Cosven

2024 干点啥

2024-03-08T11:05:00+00:00

回顾一把了 2023，也想了想 2024 干点啥好，心里已经基本有思路了。现在是下午六点半，预约了晚上7点的海底捞，前面排了 240 桌。说回来，我觉得自己的 2024 规划挺好的，从来没对自己这么有信心过 :)

有记录的日子都是美好的

在回顾与规划之间，有个小发现：从 2018 年有记录开始，我每年目标的大体相似，尤其是大方向上。不仅目标相似，连思路都相似。

生活上
1. 落户->买房->还贷->装修：虽迟但到。至今也不知道买房是否是正确的选择。
2. 多和朋友约饭、约玩：一直都做的不行。后面尝试 1v1 约吧？还是说共同兴趣过少？
3. 找对象结婚生仔：还处于经常会思考“意义是什么”的状态。流程上是有些进展，emmm
4. 多和家人联系：主观意识上有一些长进 :）
工作上
1. 之前的4-5年一直执著“提升技术深度、搞低层”。最近一年觉得，做好事情比提升技术能力要高些。但不得不说的是，技术深度也确确实实的限制了我工作的选择。
2. 对于自己需要提升什么技能，比以前清晰了很多。但对3年后仍然没有规划。
3. 最近两年都是希望能做出一件有亮点的事情，今后两年有希望。
日常
1. 在“让自己成为一个热爱生活的人”的路上，似乎有一点长进，但似乎也不多。
2. FeelUOwn：严格：要死不活。乐观积极心态：稳步前进。

2023 回忆

旅游

思来想去，2023 年印象最深的还属自驾318川藏线。回想那个时间，虽然没有工作，但心态却异常积极（好像构不成虽然但是得关系🐶）。和朋友们一起旅游是件非常开心的事情哇，“在路上” 给人带来的放松、向往感，和平常几点一线的生活也是截然不同的。

工作导致心烦意乱？

今天看到一个观点我特别认同（其实也是这篇文章提醒了我，要总结一下）

过度工作的人必然对结果有着更高的预期，但结果不是靠自己和努力就能决定的，往往期望越高失望越大，导致不可持续发展。

其实我自己不会因为工作而心烦意乱（少数情况），我对工作的要求和期望都比较低。但生活中，遇到这个问题的朋友大有人在。

技术深度这个事情

以前觉得技术很重要，一个事情技术难度高、越底层，这个事情对我的吸引力就越大，觉得搞定它会很酷、很有成就感。比如去看技术大牛们写的博客或者技术文章，就会很向往和憧憬。确实没错，这个回路确实很合理。但同时，这个行业的人，一定也经常听到这种说法， “你放眼看去，高级别的人有几个是技术大牛”。这个问题该怎么辩证看呢？最近有了新想法。

上面的回路很对，但不能光有它。个人实践了 3-5 年，我每年都觉得自己技术深度不够，然后会督促自己看看书和基础论文，短时间“深”了，但随后又会忘了，到头来“深度”还是不够。接着，我就会反思，反思的结论之一就是自己看书不够坚持。这确实也是原因之一，不过想想，还有没有其它原因呢？5 年过去了，我都没坚持下来，是不是也应该换个思路了。

总的来说，技术和解决事情两个角度，两手抓两手都要硬。当你从纯技术入手遇到瓶颈的时候，不如试试从项目入手。以前的目标可能是对的，但方式得修正下。反正我今年是准备尝试下 🐶。祝自己好运。

旅游的“好”与“坏”

有的旅游让我印象深刻，而有的旅游，则在脑海中消失的无影无踪。这个问题是我想解答的问题，但现在领悟还不够。但有一条，有记录的日子都是美好的。一说到旅游，我能回忆起来的旅游场景，都是那些我写了博客记录或发了朋友圈。仔细回味一下，并不纯粹是因为这些旅游就玩的更开心，而是游玩结束有认真的回味这次旅游。

爱情，结婚与生仔

不会。等有灵感再来记录一下。

2024 是光明的

生活：
1. 期望：让周围的人因你而感到幸福。
2. 目标：
  1. 把做饭技能捡回来；把房子装修搞好；
  2. 见老友2次；和2个以上的朋友聊聊“结婚生子”的意义；
  3. 让父母体检一次；和家人出游一次。
工作目标：
1. 短期期望：有更长远且具象一点的眼光。
2. 目标：
  1. 能对一个事情的结果负责。
  2. 善于发现同事的优点，取长补短。
其它：
1. FeelUOwn 能达到“有信心推荐给朋友用”的水平。
2. 找找旅游的最佳实践。

小小秋游-徒步栖霞坑古道

2023-12-03T11:05:00+00:00

抓到浙江秋天的尾巴，“栖霞坑古道”一日游，盗图若干。

盗图两张

再盗图三张

这次凑了两车人马，出乎意料的“热闹”。从杭州余杭九点出发，自驾到栖霞坑村，干完午饭，已是下午两点。时间仓促，只走了个古道的一小半行程。图4,5为咱一伙人穿越荆棘，爬了一个60度坡，强行登“顶”，拍了个夕阳西下（还有一位肌肉男和一位美女未出镜）。偶然发现，自己对“登顶”似乎有一些执念。

一点好奇

“为啥这村要叫坑呀？” 想起国庆路过黄山以及婺源的时候，也有很多村有“坑”。在当下流行的语言环境中，这字显然褒义偏少，有点好奇。

“坑”表示溪涧在东南诸方言中普遍存在，并大量出现在东南地区村落地名当中。此义引申自山谷义，有明确的历史来源，并与东南地区地貌特征有很大关系，是东南诸方言的广义特征词。

小脑袋，大疑问

一：桃花源记

一行人在栖霞坑村，沿河流往上走的时候，会不自觉的让人背出

土地平旷，屋舍俨然，有良田、美池、桑竹之属。。。。鸡犬相闻，其中往来种作，男女衣着

不经历_工作日的两点一线_，对_此情此景_又会有何感想？ emmm，没有《桃花源记》，对此情此景又会有何感想呢？回头看，我觉得图1,2拍的还真不错。

二：人生的意义

今日倒垃圾的时候，遇到一个人在挠头倾诉：“我感觉最近好无聊啊”。

我就想，如果我是被倾诉对象，我要怎么办呢，这可是个大难题。带ta去做点平常不做的事情？我能找到这样的事情么，2333,感觉好难啊。

如果我是倾诉对象，不，感觉自己不会成为这样的倾诉者。我可能会认为这是给倾听者徒增烦恼。但又想想，如果这样的话无处诉说，或者说这样的情绪无处发泄，也是非常难受的一件事了。还有一个问题是，作为一个成年人，又能对谁、哪个角色去诉说呢？亲人、朋友？可能是朋友。

然后联想到一个终极问题，人生意义在于什么？想了几个选项，游山玩水、、吃喝玩乐、开心、成就感、结婚生子、传宗接代…… 但感觉这些选项都比较局限，不足以概括人生意义，后来想到一个词，自己觉得比较满意的答案：活着。活着就是为了活着而已。于是想去读一读余华的《活着》。（但，看了下简介，又没那么想读了）。

三：就是想记录点什么

下次出游一定要拍集体照。（即使自己很“丑”，也想记录照片，要长肥！）
生活不缺美，只缺发现美的角度。
明天要上班，毕竟大概率要工作到很晚。太卷了！c**！
写字似乎是(我)释放情绪/感受的一个非常有效的方式。

最后

等下还有几件事情要做：洗澡；上分；吃夜宵。而今天只剩两个半小时。生活虽然很美好，但也仍需努力度过。

许巍此时此刻演唱会北京收官未删减版这个演唱会视频真不错，视听盛宴，强烈推荐的音乐视频之一！

“分布式数据库测试”这件小事

2023-05-31T08:23:00+00:00

4年前，我对分布式、数据库、测试这几个领域都很陌生，好奇心与缘分让我和它们相见。它们每一个都有说不完的故事。而我和它们的故事，则要从测试开始说起。

2024-03-22：补充“测试分层：按系统模块”这一章。
2024-03-21: 读《关于产品质量的思考 – 如何评估质量》有感。之前这篇博客主要是从“测试人员应该做什么，能做什么，有哪些可能做法” 来描述的。未来会更多补充一些“数据库测试人员能做什么、怎么做”。
2023-05-31: 补充“分层测试：从黑盒到白盒”这一章。
2023-05-25: 补充了测试的一些其它角度：理念与流程、DFX 专业技能。
ps: 后续可以注意看这篇博客的 TODO 标记。

QA 就是测试，测试就是 QA？

说到测试，我现在会很本能的想到 QA 这个词。我之前的工作职位叫作 QA，别的同事也会用这个称呼来代指我的岗位或我所在的小组。“QA 就是测试，测试就是 QA ”，这可能是很多人的直观印象和认识，我一开始差不多也是这样理解的。

但仔细想想，就会发现这个理解有很多说不通的地方。写单测是测试，研发要写单测，研发是 QA【纪晓岚式微笑】。但这个说法显然会让少部分研发“恼羞成怒”，你才是 QA，你全家都是 QA【狗头】。

我以前特意搜过，“什么是 QA，QA 是干啥的？”等类似问题。然后我看了好几篇文章，当时还做了点笔记。其中有一篇是“网红”文章，它是左耳朵耗子在 2012 年写的《我们需要专职的QA吗？》。我觉得这个“标题”放在 2023 年，仍然足够吸引眼球。还有两篇是《测试团队与咖啡店》和《软件测试团队“核心价值”的思考》，它们同样引人思考。我个人觉得这些文章都反映了一个问题，对于如何做好测试这件事情，行业里还没有一个开源的范本，大家要走的路还很长。一位同事说华为发布出来的产品质量不错。华为对质量比较看重，有完善的流程支持，质量保障体系比较完善。

QA 全称是质量保证（Quality Assurance），不管是 QA 或是测试这个事情，它们共同的宏伟目标是保障产品质量。作为一名 QA，当时我就在想，怎样衡量产品质量？什么是保障的好，什么是不好。

质量好坏的量化

“质量好坏”短期往往是难以量化的，数据库业界至今也没有一个好的标准。测试覆盖率、产品问题数等指标虽然有一定的参考意义，但也有一些显然的不足。比如，代码行覆盖率即使很高，质量仍然可能很差，而“分支覆盖率”/“MC/DC覆盖率” 等指标又存在“全集难以计算”或“提升成本很高”等问题。对于一个讲究“快速迭代”的行业，产品问题数则和用户数、新特性数量、以及用户使用场景/时长有明显相关性，同比环比等计算策略在这样的情况下同样无法使用。

回到 QA 的话题，假设质量好坏能量化，其能反应 QA 工作的好坏么？显然也不能。举个例子，某个模块质量变好了，完全可能是因为代码换了一位“牛人”来写，鲁棒性更好了。既然如此，是时候改变一下 QA 的定位和目标了。

2024-03-21 更新：之前是站在“测试人员应该做什么，能做什么”的角度来写这一片博客的，今天读了唐刘：关于产品质量的思考 – 如何评估质量，这篇文章里面提到了几种评估质量的维度，记录一下：

bug 维度：漏出去的 bug 数量；bug 收敛趋势，算法是：新修复-新发现； bug 趋向于聚集，这个观点在《软件测试的艺术》这本书也说过。
feature 维度：个人理解讲的就是要保证在质量方面上的花的时间。
文章还提到了客户场景的测试覆盖。可以理解为 test 角度。

除了这些维度外，个人认为覆盖率是衡量质量一个永恒的指标，就看测试人员是否能把这种覆盖率指标给量化出来。如用户场景覆盖率、优化规则覆盖率、一致性模型覆盖率等。

行业需要 QA 吗？

前段时间一个群在讨论数据库测试的事情，有ex同事说

好的数据库，不需要 QA。倒逼研发在开发环节的开头就控制住质量。丰田模式。

然后又有一个ex同事截图了《分布式系统测试那些事儿 - 理念》这篇文章的一小段话

我们现在很有意思的一个事情是，迄今为止 PingCAP 没有一个测试人员，这是在所有的公司看来可能都是觉得不可思议的事情

这其实和左耳朵耗子 2012 年那文章讨论的问题有点像，“我们需要 QA 吗？”。 2023 年了，这问题仍然会被大家拿出来讨论，感觉很有意思。

个人觉得《测试团队与咖啡店》这篇文章的观点不错，（不错还不足以形容我对它的看法，很好！三年前的我应该是没能领悟这段话的含义。）

当开发人员对测试团队说“我需要你们在每次提交后对产品进行测试”，他真正想要的只不过是能够有一种机制，使得每次代码提交之后都能验证产品是不是存在明显的问题。通过 CI、分层的自动化测试，测试团队可以用更轻松、更快捷也更优雅的方式解决开发团队的问题。在这个基础上，也许你还可以说服开发团队建立一系列的标准，用于评估产品的生产率和质量，让测试团队和开发团队一起推动持续的生产率增长和质量提升。

写代码，测试，流程规范与思想理念，每个都得要。谁来做呢？

分布式数据库的测试

特性测试（开发来测如何？）

要保障数据库一个功能或特性的质量，制定合理的测试计划，设计有效的测试用例。除了要遵守质量保障的流程规范，了解常见的测试用例设计方法，更需要了解甚至熟悉这个功能，从用户使用方法到底层实现原理。

分布式数据库所涉及的知识面是非常广的，且每个具体的垂直领域都会涉及比较深。从存储、共识算法、事务、执行器、优化器、网络通信协议等基础理论，到用户负载、数据库基础运维，再到特定场景或问题的解决方案，要接触了解每一个点，就需要很丰富的积累，更别说熟悉它们了。可能只有“架构师”的心里才能完整的绘出这副图。

从用户使用角度来看，用户和分布式数据库直接交互的方式主要有三类。第一类是通过 SQL 与之进行数据信息交换。第二类是运维操作，比如扩缩容、滚动重启、配置修改等。第三类则是数据备份恢复、数据同步等。简单使用数据库的这三类功能，我相信大部分人稍微花点时间都能掌握个大概。

以 TiDB 的 GC in Compaction Filter 特性为例，在有固定流程规范的背景下， 谁花最少的时间就能学习并掌握这个特性的测试工作呢？我觉得是写代码的人。因为其它人学 RocksDB 和 Compaction Filter 等繁琐的原理效率很可能不够高。不过听一位以前的同事说，华为是让测试团队的人来学习，写代码的人负责讲解。我认为这样做的代价是周期更长，需要的人非常多，好处则是变相引入了 reviewer，测试会更周全。

以上是把“数据库的一个非常细节的功能”当成一个功能/特性，尝试给出我个人对上面“谁来做呢” 这个问题的理解。但如果变换一个看问题的粒度，把 CAP 中的 C 或者 A 当成分布式数据库的一个特性呢，或者把数据库的性能看成一个特性呢，我觉得上述问题则可以有完全不同的答案。

系统测试与自动化

我觉得自己算是一个喜欢折腾概念的人，因为我感觉概念最能让一个东西从模糊变得具体。因此我工作的时候花了些时间就去寻找系统测试的概念，比如查维基百科、看《软件测试的艺术》这本书，但我记忆中，它们都没有给出让我非常信服的定义。比如维基百科是这么说的

系统测试是将需测试的软件，作为整个基于计算机系统的一个元素，与计算机硬件、外设、某些支持软件、数据和人员等其他系统元素及环境结合在一起测试。在实际运行环境下，对计算机系统进行一系列的组装测试和确认测试。系统测试的目的在于通过与系统的软件需求作比较，发现软件与系统定义不符合或与之矛盾的地方。

我觉得它说的可能没错，未来的某一天，说不定我能理解。但现阶段我觉得它讲的还是过于模糊了。不过这里有句话还是有点启发的 系统测试的目的在于通过与系统的软件需求作比较。那本书，我记忆中（我的书怎么不见了，尴尬）没有下定义，但它把性能测试、配置测试等都划分在系统测试这一章节下，作为其子章节。

我也想当一回发明家，给它来个定义如下

系统测试是对系统大粒度垂直领域进行的测试，比如性能测试、稳定性测试、正确性测试等。也可以叫做主题测试。

– Cosven

关键字一：垂直领域。数据库的特性何其多，纷繁杂乱，了解熟悉起来费时费脑，需要很多很多工程师。工程师又叫什么？码农！我觉得这个称呼其实还是挺有有道理的。学习数据库的小特性，就像了解一个高楼大厦的每块砖是如何码的一样，琐碎，费劲。关键是，就算花了几辈子去学，可能还不如当初那些亲手码砖块的人熟悉那几块砖，人家“码农”心里可能一清二楚。但如果你从万千砖块中提取一个垂直领域，比如承重墙的码法，在这个领域上日积月累，那你可能就是“承重墙砖家”。【笑死】分布式数据库领域可以有存储、计算、分布式砖家，也可以有性能、正确性、稳定性砖家嘛。存储砖家加分项是有性能调优经验，那性能砖家加分项则可以是有存储设计经验，稳定性砖家加分项可以是有分布式系统经验。

关键字二：大粒度。粒度大了，测试时就不需要去了解每个小特性的繁琐细节了。把分布式数据库当成一个系统，把稳定性当成一个领域，针对这个领域进行的测试则是稳定性测试。该测试的输入可以很简单，比如上面提到过的 SQL，以及运维操作。以不同顺序在不同的系统规格下可以组合成为不同的负载。大自然的混沌力量偶尔也会是成为一种输入，我愿称之为错误注入。然后把类似“吞吐是否抖动”等作为测试的检测点，这测试就有了。根本不需要关心数据库是如何解析、执行 SQL 的，也不需要关心数据是如何存储的。【爽歪歪】

相比于单测和集成测试，系统测试的自动化通常会比较复杂，系统测试离研发举例会比较远，不过 TaaS 是个好东西。

测试分层：从黑盒到白盒

2023-05-31 更新：测试分层这个概念很早之前就知道，但个人对其理解还非常不够。最近也在面试中多多少少交流了一些测试技术，而其中另我感受最深的一个就是分层测试思想。

分层测试思想说起来还是挺常见的，比如一个常见的开发流程，从编译、静态分析、单元测试、集成测试、功能测试和系统测试。这是一种维度的分层，这种分层基本是按照时间维度，基本可以认为，前一个测试没有通过，后面的测试就没必要进行。也还有很多其它的分层维度，按照子系统/模块分层，mock 其它模块；或按照测试粒度，有黑白灰盒。这里想探讨（其实是记录）的是按粒度的分层思想的实践。

聊测试这个话题的话，我发现大家最喜欢的还是聊性能测试。稳定性的话，测试从业者也聊的比较多，兼容性等也比较多。正确性这种似乎就相对比较少了。昨天听到一个关于“性能测试”的分层实践经验，感觉挺不错的，记录一下：

场景是 AP 数据库，它们不仅会测 TPCH,TPCDS 等标准负载，还会给每个“算子”设计测试用例，量化每个算子的性能。感觉是一种不错可以落地的实践。但是它怎样保证测算子的负载是有效的呢？这是一个问题。

对这个记忆比较深的原因还是在于：思想大家都懂，但能落地不容易。比如这个思想要在一个分布式存储的共识算法层去落实，则可能需要自己设计实现新接口，甚至 mock 底层存储，这样实践难度明显就更大一些。其实回看一下，特性测试和系统测试就是一种典型的按粒度分层的测试。根据过去经验，特性测试对于重要的子系统/模块的质量保障还是非常重要的。

分层测试是一个非常棒的思考角度，也是一个非常好的实践思路。以后可以多关注分层测试的实践经验，找点灵感。TODO

测试分层：按系统模块

数据库主要几个模块：传输层（或者叫协议层）；优化器层，包括 SQL 解析、改写、执行计划优化与生成；事务层；执行层（火山模型；MPP）；存储层（保证数据的可用性，正确性）。

优化器，常见问题有几类：rqg，sqlancer。
- 正确性：比如表达式改写错了。
- 性能：执行计划不优/跳变等。
事务层，常见问题是正确性：jepsen + model。
- MVCC/隔离级别的正确性。
- 与算子/缓存/索引等结合的正确性。
- 混沌场景的正确性，比如时钟、节点挂。
执行层，常见问题是性能以及稳定性，正确性问题也是重点：性能测试，压力测试，rqg。
- 如某算子性能回退
- 执行过程 OOM。
- 某算子 panic
- 算子计算错误。
存储层，常见问题是：系统测试，model/property-based testing。
- 高可用，比如混沌场景。混沌测试。
- 性能稳定性（比如compaction,补数据）。
- 数据一致性与正确性（比如多副本数据一致性等）
- 运维时的易用性与正确性（比如某个节点挂了补副本，上下线节点等）
传输层，常见问题偏功能或稳定性相关的，比如包太大，链接管理等。

待完善（TODO）

2023-05-25：这篇博客之前一个核心的思想是：开发应该对质量负责，开发参与特性测试是一种高性价比的实践。测试则可以专注在测试效率提升，以及系统测试的某一个垂直领域。但后来我在思考职业规划的时候，觉得这个思路还有一些可以补充的地方。主要是几个方面：开发应该怎样进行特性测试；垂直领域之下的专业技能是什么；质量理念与测试活动。

系统可测性

下面问题是否是可测性的需求的征召？

对一个特性的质量没有把握时，没把握的原因会不会就是可测性不行？

对于可测性，自己感觉理解还比较浅，下面罗列一些常见的话题，以便以后学习

valuable（产生实际价值的）
1. failpoint/syncpoint: 确定性的错误注入
2. continous profiling: 性能问题定位
3. invariants: 正确性测试
4. metrics：问题定位，负载模式判定
unknown（可能有价值的）
1. telemetry: 功能覆盖率？？
2. 100% MC/DC test coverage (ref: sqlite3)：提升质量信心？
3. valgrind：内存问题定位？
4. tracing：问题定位？包括性能以及稳定性。

发散性思维？？？

很气愤，刚花了一个小时画好的脑图，被我不小心移到回收站之后，要收我巨款才能还原， MindMeister，建议不要用！！！还是自己写个文字版吧。

大的分类：功能测试和系统测试
性能测试
- 基准测试：一定的负载和压力下的性能表现
- 容量测试：例如单机规模，集群最大规模
- 扩展性测试：水平线性扩展，垂直扩展
稳定性测试
- 可靠性测试（crash 测试，破坏性测试）
- 可用性测试（可恢复性测试）
- 性能抖动测试：
- 长稳测试（压力测试）：
兼容性：升降级；配置兼容性；内核工具兼容性。
一致性：事务（ACID）；数据副本一致性。
安全
…

数据库子系统的测试技术

SQL 执行：随机测试。
优化器：？？？sqlancer？
共识算法/一致性：不变量/混沌工程/可测性（jepsen）。
性能：分层；mock；profiling。

质量理念与测试活动

测试流程
质量量化
用例/bug管理
？？？

带着故事睡觉

故事是讲不完的，睡觉！

读《Operating Systems: Three Easy Pieces》

2023-05-29T06:00:00+00:00

2023-05-29：若想深入的传播一个知识或描述一件事情，按“主题”维度来进行组织，是我目前见过的最有效的方式之一。这本书分四个主题，虚拟化(Virtualization)、并发(Concurrency)、存储(Persistence)、安全(Security)。今日看了内存虚拟化这块，由浅入深，引经据典，清晰易懂。好书！这本书另外一个非常赞的地方则是，它在每一章开始部分都会提出一个问题来引导读者，问题是最好的老师！

[-] CPU虚拟化
- 2020-10-19 第4章进程
- 2017-03-14 第7章 CPU 调度
内存虚拟化(第12-24章)
并发
[-] 持久化
- 2023-06-06 第36-37章

虚拟化（CPU）

进程

进程就是一个运行中的程序。怎样同时运行多个程序？time sharing + context switch + scheduling。

进程由什么组成？看进程的机器状态（machine state）是什么:

内存中有什么？地址空间：进程可以寻址的内存。
寄存器，部分特殊的寄存器，如 program counter(PC, 也称 instruction pointer IP)； stack pointer，frame pointer
存储设备，I/O information（比如打开的文件列表）等

程序怎样变成进程？

从 disk 到内存
分配 run-time stack
堆内存分配？
初始化 I/O，比如 stdin/stdout/stderr

进程状态？Running 和 Ready 可以自由切换；Running 遇到 I/O 变成 Blocked；I/O 完成变成 Ready。

进程相关的数据结构？

PCB: process control block, just a structure that contains information about a specific process.

常见的相关问题? top 中显示的 D(disk sleep) 状态：https://stackoverflow.com/a/1475715/4302892。在进行 read/write 等系统调用时，进程会进入这个状态。

Sleeping 状态：一个进程需要等待某个资源，进程可以主动进入该状态，也可以是操作系统调度它进入该状态。
Runnable 状态：一个进程资源都有了，但缺 CPU。
Stop 状态：比如 zombie（为什么要有 zombie 状态？父进程需要知道子进程的状态）。

CPU 调度

参考资料：http://pages.cs.wisc.edu/~remzi/OSTEP/cpu-sched.pdf

本来的目的：了解 Round Robin 算法。记忆中 Round Robin 也是最早出现在进程调度里面的，于是找了本书来看下。如果之后能瞄一眼源代码的话，应该会比较好把。

这一章解决的几个问题：

How should we develop a basic framework for thinking about scheduling policies?
- 确认评价标准？
What are the key assumptions?
- job 一运行就运行到底；job 运行消耗同样的时间
- job 同时达到
- job 运行时间已知
- job 没有 I/O 操作
What metrics are important?
- turn around time
  - Shortest Job First
  - Shortest Time-to-Completion First (STCF)（job 不是同时达到的）
- responde time
  - Round Robin
What basic approaches have been used in the earliest of computer systems?
- FIFO

Round Robin 基本思想

The basic idea is simple: instead of running jobs to completion, RR runs a job for a time slice (sometimes called a scheduling quantum) and then switches to the next job in the run queue.

虚拟化（内存）

地址空间

它从地址空间（address space）开始讲，地址空间是对物理内存的抽象。地址空间最主要的一个用处是，它简化了程序使用内存的方式（easy to use）。有点惊讶，从易用性出发（其实也有性能方面的考量），竟然可以有这么伟大的发明。

内存虚拟化有几个目标：

透明（transparentcy）：程序可以假设自己拥有所有内存。
高效（efficiency）：时间和空间。比如 TLB 技术。
安全（protection）：进程和进程之间是隔离的（isolation）。

课后作业里面提到 pmap 这个工具，感觉挺有意思的，但不知道实际有哪些应用场景。问题了下 chatgpt，说是可以分析内存碎片、安全审计等等。

插曲：内存相关接口

这一章主要介绍了 malloc/free 等在对上申请/释放内存的接口，没细看。有一个刷新我认知的知识，malloc 和 free 不是系统调用，brk,sbrk,mmap 这种才是， brk 和 sbrk 都是给库函数用的。然后 calloc 和 realloc 这种函数也有一些使用场景。

书里面提到了几种常见的内存使用错误，挺有意思的，摘抄一下

忘记申请内存了

 char *src = "hello";
 char *dst; // oops! unallocated
 strcpy(dst, src); // segfault and die

内存申请的不够（注：虽然大概率能正确运行，但是它并不正确。malloc 的长度应该要再 +1）

 char *src = "hello";
 char *dst = (char *) malloc(strlen(src)); // too small!
 strcpy(dst, src); // work properly

忘记初始化申请到的内存了
忘记释放内存
还没用完就把内存释放了，通常也叫做 dangling pointer。
重复释放内存，通常也叫做 double free。
free 的参数不对，理应传入 malloc 返回的指针。

书里面还提到 purify 和 valgrind 这两个内存工具。valgrind 听到好多次了。跟着课后习题，试玩了一下 valgrind，算是上了个手。搜了下 “valgrind rocksdb bug”，发现确实有个 issue 说自己遇到 SIGSEGV，然后用 valgrind 可以更方便的定位错误。从 issue 的信息中可以看到，valgrind 可以把出问题的栈完整的打印出来，理论上对问题定位应该挺有用的，不知道它性能如何，能不能在 E2E 测试中使用。

地址转换

这一章主要还是介绍了地址转换这个概念。书里还介绍了 Base-and-bounds 这种最基础的方法，来帮助读者理解地址转换，但这种方法也有很多不足指出。我想后面几章应该会讲它的一些演进。

地址转换（address translation）也是为“高效且灵活的虚拟化内存”这一目标服务的，把地址空间和实际物理内存地址映射起来。地址转换有很多的实现办法。书中先把需求最简化，然后讲了一种硬件方法（Dynamic (Hardware-based) Relocation），这里它讲到一个方法是 Base-and-bounds：在硬件上把一段内存的左右边界地址保存起来，然后进程实际用的就是在这段内存内进行偏移。这里顺便引出一个概念，内存管理单元（MMU）。

We should note that the base and bounds registers are hardware struc- tures kept on the chip (one pair per CPU). Sometimes people call the part of the processor that helps with address translation the memory management unit (MMU);

这让我想起一个故事：大家在讨论进程、线程、协程的时候，经常会聊到“上下文切换”的成本高低。当时就有个人提了个问题，你们知道“上下文切换”要切换哪些东西吗？现在算是能回答一点了。

分段（Segmentation）

这一章主要介绍了分段的基本思想和原理，以及它的不足。整体来说还是比较易懂的。

分段这个思想可以解决 Base-and-bounds 这个方法带来的空间浪费问题。 Base-and-bounds 这个方法带来的空间浪费问题主要侧重在 internal fragmentation。这个思想至少可以追溯到 1960 年代初期。简单来说：就是把一个区间分成多个区间。具体来说，书中举的例子是把 stack/heap/code 这三个部分各看成一个 segment。

书里提到 segmentation fault 这个概念，记录一下

The term segmentation fault or violation arises from a memory access on a segmented machine to an illegal address. Humorously, the term persists, even on machines with no support for segmentation at all. Or not so humorously, if you can’t figure out why your code keeps faulting.

即使有了 Segmentation 这种方法，external fragmentation 的问题仍然需要被解决（缓解）。

The general problem that arises is that physical memory quickly becomes full of little holes of free space, making it difficult to allocate new segments, or to grow existing ones. We call this problem external fragmentation

这个问题在各种算法中都存在，只是说哪个更优，比如有一些策略：

including classic algorithms like best-fit (which keeps a list of free spaces and returns the one closest in size that satisfies the desired allocation to the requester), worst-fit, first-fit, and more complex schemes like buddy algorithm

空闲空间管理（Free-Space Management）

这一章主要是讲内存分配这个主题，其中又侧重 free-sapce management 这个问题点, 这个问题的一个核心子问题就是外部碎片问题（external fragmentation）。讲了内存分配需要考虑哪几个基本问题，然后又介绍了几种简单的策略帮助读者理解这个问题，然后又介绍了几种实践中用到的策略。最后总结，主要从效率和空间浪费两个角度来考虑这个问题，不同的负载下，有不同的最佳策略，是一个利弊权衡的过程。

讨论是从研究用户态内存分配器入手，讨论时先忽略内部碎片这个问题。讨论的另外一个重要假设是分配出去的内存不会被迁移到其它地方，也不会对 free-space 进行 compaction 这样的操作。还假设分配的内存是一个连续的、固定大小的区域。

介绍了底层的一些机制（也就是内存分配频繁涉及的一些问题和策略）：

Splitting and Coalescing（free list 的分裂和合并）。以满足内存申请需求。
Tracking The Size Of Allocated Regions。free 接口接受的参数是一个指针， allocator 需要知道指向的内存块的大小。一个常见的实现办法是划分一个 header 来存储这个大小的信息。(RocksDB 就是依赖这种办法来统计 block 大小的。)
Embedding A Free List。大意是这个“空闲空间管理”的数据结构本身也要占内存，怎样存储它是一个常见问题：而常见方式是在头部存链表的 head 节点。
Growing The Heap。一种常见实现是应用调用 sbrk 系统调用，操作系统会把一些空闲的 page 分配给它（物理上不一定是连续的，进程看到的是连续的）。

空闲空间的几种常见管理策略

best fit：空间浪费少，但搜索效率低。
worst fit: ？找一个空间最大的块，仍然是全局搜索。
first fit: 。
next fit：每次搜索完，记录指针所在位置，下次搜索是上次的位置继续。

书中说这几种策略只是非常初级的策略，实际会更复杂。这几种只是让读者有个印象。后面又列了一些实际应用的一些（优化）策略：

Segregated Lists。大概意思是把空闲空间分几个链表来管理，每个链表管理的空闲空间大小都是一样的，比如都是 8Byte/16Byte。这样在效率和空间两方面都不错。书中举了 slab allocator 这个例子。
Buddy Allocator。考虑到 Coalescing 这个操作对分配器来说是非常重要的，举的例子是 binary buddy allocator。
其它：使用一些平衡二叉树等数据结构来保存空闲空间，提升搜索效率。

Paging: Introduction

这一章我只是粗略的看了下，它主要介绍了 paging 这个思想，操作系统是如何实现这种策略的。操作系统把物理内存分成大小相同的页（page），用户态的分配器来申请内存的时候，也是申请一页或者多页。每个进程会有一个 page table 来保存虚拟地址和物理地址的映射。 page table 这个东西设计时又需要考虑几个因素：效率和空间占用。后面两章会讲一个高效的 paging 实现是怎样的。

这里面说了几个概念

Instead of splitting up a process’s address space into some number of variable-sized logical segments (e.g., code, heap, stack), we divide it into fixed-sized units, each of which we call a page.
we view physical memory as an array of fixed-sized slots called page frames, each of these frames can contain a single virtual-memory page.
physical frame number (PFN)
physical page number or PPN
Page Table Entry (PTE): page table 由众多 entry 组成，一个 entry 里面不仅会由虚实的映射，还有有一些 flag,比如这个 page 是否脏了，读写权限等。

Paging: Faster Translations (TLBs)

这一章看的也比较粗略，它主要介绍了 TLB 的作用和具体实现。也简介了 TLB 的不足。后续有需求的话，其实可以再细致的看一下。

注：这个问题也是从两个角度出发：OS 角度和硬件角度。上面提到的很多问题都是从这两个角度来思考。

TLB 算法简述：算法的输入是虚拟地址，输出是物理内存地址。TLB 接收到请求时，如果发现虚拟地址对应的 TlbEntry 在缓存里，直接返回（返回前还会判断一下这个 TlbEntry 的一些状态，比如 ProtectBits 的值）。如果不在缓存，算一下，然后加载到缓存，然后走类似的返回逻辑。传统的 x86 架构的 TLB 是一个硬件单元，一些现代的新架构，如 RISC 可以在软件层面来管理 TLB。

这种缓存在很多场景都非常有用，比如遍历一个数组。原因在于其空间局部性（spatial locality）。

重要概念

TLB: translation-lookaside buffer。这个名字有一些历史原因，叫做 address-translation cache 更形象。它也是 MMU 的一部分。
TLB hit/miss：缓存就会有 hit 和 miss，很合理。
locality：There are usually two types of locality: temporal locality and spatial locality. With temporal locality, the idea is that an instruction or data item that has been recently accessed will likely be re-accessed soon in the future.

Paging: Smaller Tables

粗略的读这一章，这一章主要介绍了几种 page table 的优化方案（对于特定场景来说）

Bigger Pages：这种思想的一个问题在于会加重 internal fragmentation 问题。
Hybrid Approach: Paging and Segments。Hybird 的方法在均衡两者优劣的背景下，通常还会给逻辑处理引入复杂度。
Multi-level Page Tables：想象一下，把 page 分几个字文件夹（page directory）。
Inverted Page Tables: 只存一个 page table, 然后在这个 page table 上记录一个 page 被哪些进程使用。
Swapping the Page Tables to Disk。

跳过剩下的3个章节

越后面的章节，内容越细，也就是说，用到的概率越小了。我自己暂时还没有产生这方面的疑问，阅读的效率可能比较低，遂先跳过。但不得不说的是，计算机很多问题的本质都是相似的，比如缓存；空间换时间；两种方法混合（均衡优劣）；分段和分页思想。我想，以后应该还会遇到这种问题，到时候再来看应该能有新的收获。

Swapping：Mechanisms
Swapping：Polices
Complete VM Systems：介绍了 Linux 的 VM system 是怎么实现的，先跳过，嘻嘻。

持久化（Persistence）

I/O 设备

这一章回答的关键问题是：怎样把 I/O 集成到系统中。

读完之后，尝试回答一下这个问题：I/O 设备先通过 SATA/PCI-E 口连接到主板。这些设备会提供一些接口，简单一点的比如几个寄存器，操作系统通过读写这几个寄存器，来完成和设备之间的数据传输及控制。为了提升性能，设备本身可能还有一些优化，比如磁盘设备会通过 DMA 技术来降低数据拷贝时的 CPU 消耗。

从系统架构角度看：书中提到一个点，高性能的 I/O 设备通过一个通用的 I/O bus 来连接，在现代系统中通常对应 PCI。低性能的设备通过 peripheral bus 来连接，比如 SCSI, SATA 或 USB。注：这让我联想到 PCIE SSD。再次搜了下，PCI-E 和 SATA 一个典型的区别在于 SATA 最高带宽是 6Gbps（第三代 SATA，即 SATA3）。另有资料表示 PCI-E 的带宽对现代部分显卡已经不够用了。书中给的两张系统架构图（以前和现代）非常直观。

从设备角度看：设备通常有两个重要组成部分，一个是设备对系统提供的硬件接口；另外一个是它的内部结构（比如现代的 RAID 控制器由一个固件来实现它的功能）。

从设备和系统的（通信/交互）协议来看：书中举了一个例子，一个设备提供的接口由三个 Registers 组成，status, command, data。然后计算机可以通过 polling 的方式来处理通信过程。但 polling 在部分场景会有性能不够好的问题，接着进入下一章：通过中断（Interrupts）来减少 CPU 开销。polling 的方法也叫做 PIO（Programmed I/O）。当设备速度足够快的时候，中断可能会降低性能。

当使用 PIO 这种方法来传输大量数据时，CPU 会花很多时间在内存和设备之间拷贝数据。 DMA（Direct Memory Access）这种办法可以用来解决这一问题。

设备驱动（device driver）：让设备可以与操作系统以最优的方式进行数据传输。这里有一个案例学习，一个简单的 IDE Disk Driver。

硬盘驱动（Hard Disk Drives）

这一章解决的关键问题是：怎样从磁盘读写数据？

这一章更多的其实是讲怎样高效的读写。因此介绍了磁盘的结构，磁盘需要旋转和seek, 这两个操作非常耗时，它是一切问题的根源。当下，我们常说随机读写和顺序读写，本质也是这个问题。除此之外，操作系统也设计了一些调度算法来优化读写的延迟，电梯算法。

磁盘对操作系统提供的接口：由很多扇区（sector，512-byte block）组成，每个扇区都可以读写。类似 paging。单个扇区的写入是原子的（atomic），多个扇区写入可能会由于断电而引起写入不完整（torn write）。磁盘顺序读写比随机读写性能更好。

磁盘结构中的一些主要概念：磁盘臂（disk arm）；磁头（disk head）；轨道（track）；盘片（platter）；缓存（track buffer，cache）；write back caching （写到 cache 即算完成）； write through（写到磁盘才算完成）等等。

一个简单的磁盘驱动器：介绍了几个响应时间。盘片转动的时间（rotation delay），磁盘臂寻找轨道的时间（seek time，>=0.5~2ms）

I/O 延迟计算：T(I/O) = T(seek) + T(rotation) + T(transfer)。一个磁盘卖的时候，参数里面一般会包括 average seek time, RPM, 带宽。通过这几个参数，可以基本计算出随机读的延迟。

磁盘调度：几中调度算法

SSTF(shortest seek time first，也叫 shortest-seek-first SSF)。这种有几个不足：seek 时间只能估算，操作系统没有准确值；还有一个是常见问题，饥饿。操作系统能准确知道的是这个数据在哪个 block。
电梯算法（SCAN, 也叫 C-SCAN）。简单理解就是：在上升过程中（上下对应磁盘里外），只处理顺路的请求，不顺路的等下降的时候再处理。这种算法有些许变种，常见的一个是 C-SCAN（Circular SCAN），它总是从外到里处理。书中它的好处是更加公平，因为本来的算法对处于中间位置的请求更有利（我理解它说的可能是最坏时间吧）。电梯算法解决了饥饿问题。不过电梯算法没有考虑 seek/rotation 的成本。
SPTF(Shortest Positioning Time First)：考虑了 seek/rotation 成本的算法。这种算法常被用于驱动中，因为操作系统往往对这些硬件的内部结构细节不够了解。

其它调度：I/O merging, work-conserving/non-work-conserving。

RAIDs

这一章的核心问题是：怎样创造一个大、快、可靠的磁盘。跳过。

读《The Ubiquitous B-Tree》

2023-05-24T10:05:00+00:00

读完这篇论文，有种盲人摸象的感觉。好在确实对 B-tree/B+-tree 的基本原理有了些了解。比如一些基础的概念，B-tree 的 order，B-tree 的插入/删除算法（里面涉及到平衡）， B+-tree 相比 B-tree/LSM-tree 的优劣势。但它总归只是一个理论，和实践还是感觉差距太远，没有“原来是这样”的感悟。后续可以尝试结合 InnoDB 的实现来阅读，但记住，一定要带着问题。现在就有点缺少引发思考的问题。

简介

先介绍背景：访问组织好的文件的方式通常有两种 Sequential and Random。然后说，对于随即访问，有 index 访问起来会更快，这里用文件夹和文件夹上的 A-Z 来描述索引，生动形象。（其实比作字典索引，也挺形象的。）

这篇论文的核心内容：比较了 B-tree 的一些变种，尤其是 B+-tree，展示了为什么它变得如此流行。论文还调查了 B-trees 相关的一些论文。另外，它还讨论了一种基于 B-tree 的通用文件访问方法。

注：当我基本看完这篇 paper 的时候，我发现它对 B+-tree 的描述并没有很多

B-Tree 基础

B-tree 的基本性质，order 是变量。插入删除时都要保证这个性质。

In general, each node in a B-tree of orderd contains at most 2d keys and 2d + 1 pointers, as shown in Figure 4. Actually, the number of keys may vary from node to node, but each must have at least d keys and d + 1 pointers. As a result, each node is at least 1/~ full

B-tree 的优雅之处在于插入和删除都能保持树的平衡。任何一个查找操作最多访问 1+logdN 个节点，N 是节点总数，d 是 order。如何保持平衡（balancing）是这里着重介绍一个点。

插入遇到节点 full 的话，需要 split。最坏的情况，是一直递归到 root， root 进行 split，这样树的高度会加一。删除的时候，如果是删除一个非叶子节点，则需要补一个相邻的节点进来。通常是找比它大的那个相邻节点。如果遇到 underflow 的话，也要重新平衡，就从邻居叶子借一个过来。也可以多借几个来让两个邻居更均衡。如果加起来还不够 2d，则可以 concatenation。

查询，插入，删除的最坏复杂度都基本是logdN。插入和删除的细节看 wikipedia 更好懂一点，2333。一个不足是它的 next 性能不够好，logdN。并且一个查询要把沿路的节点都记录下来，并且要缓存 h（高度）个节点。

Unfortunately, a B-tree may not do well in a sequential processing environment. While a simple preorder tree walk [KNUT68] extracts all the keys in order, it requires space for at least h = logd(n + 1) nodes in main memory since it stacks the nodes along a path from the root to avoid reading them twice. Additionally, process- ing a next operation may require tracing a path through several nodes before reaching the desired key. For example, the smallest key is located in the leftmost leaf; finding it requires accessing all nodes along a path from the root to that leaf as shown in Figure 12.

B-tree 变种

插入和删除的时候，split 和 contatenation 都可以延迟，通过和邻居平衡。

B*-trees 是一种节点必须有 2/3 满的树。单节点满的时候，从旁边的节点挪一挪。两个节点满的时候，正好分为 3 个 2/3 的树。说这种方法，空间使用率最少有 66%。
B+-trees，只有叶子节点有 key，上层只有 index。index 的值不一定是存在的，部分 delete 操作可以不需要处理 index。index 与 key 分离。
Prefix B+-trees，给 index 省点空间。对一和二没太明白。

Thus, virtual B-trees have the following advantages: 1) The special hardware performs transfers at high speed, 2) The memory protection mechanism isolates other users, and 3) Frequently accessed parts of the tree will remain in memory.
Compression，key 的前缀压缩和指针压缩。指针压缩可以是基础地址+偏移。
Variable Length Entries，没看懂论文说了个啥。
Binary B-trees，order=1 的 B-tree，适用 one-level store，不懂这是啥。
2-3 Trees and Theoretical Results，也是适用 one-level store。说空间利用率还不错，可以有 69% 左右。然后说消除自下而上的更新对性能影响很大。

The small node size makes 2-3 trees impractical for external storage, but quite appropriate for an internal data structure.

InnoDB 的 B+-tree 结构

Jeremy Cole 的几篇博客介绍的还挺好的，图文并茂。 B+-tree 的 Node 在 InnoDB 里面对应的概念是 Page，一个 Page 默认 16KB。

叶子节点的 page 的大致结构长这样，非叶子结点有点不一样。主要区别就是非叶子节点的 page, 它的数据里面存的不是 key/value,而是一个类似指针的接口，里面存了 min key 和 page no。 page no 是叶子节点 page 的索引。 B+-tree simplified leaf page non-leaf page

在一个 level 里面，page 与 page 是双向链表 level

Page 的详细结构（按照我目前的理解：一个 page 并不是对应一个文件） detailed-page

这里只记录了基本的 B+-tree 结构，没有纪录 InnoDB 是怎样处理读取，写入，删除的。

职业规划思考

2023-05-18T07:04:05+00:00

最近开始找新工作了，但要找什么样的工作呢？还是有点点迷茫，仿佛回到了 2019。

2023 年版本

思考了几天，思绪仍然混乱，这是“写博客”的信号。写博客是我目前最好的沉思方法。 19 年因为这个问题写了这篇博客，当时说“技术深度不够”，这个问题今天仍然存在。至于“兴趣爱好在哪”这个问题，现在倒是觉得很多东西都足够有趣，更多是结合现实看。

目前纠结的点主要是在数据库测试和数据库开发这两个方向。对于数据库测试方向，过去有四年工作的经验，有一些“测试+分布式+数据库”的积累，基本套路还算清晰，就是对未来成长路线有些不清楚。而对于数据库开发，只是潜意识觉得自己对它更感兴趣，但可以做什么，以及入行需要什么技能，还是挺不清晰的。

为了避免“做什么错什么”的尴尬境地，还是要把解决思路给弄弄清楚

工作哪三要素对我来说最重要？
把自己的担忧清清楚楚的写明白，这个“迷茫”的问题是不是就能解决了？
- 比如对“测试”这个岗位的担忧到底是什么？
- “开发”的哪个点让我觉得它很有趣？
看有哪些数据库测试或开发的岗位，看看其中有哪些能投的？
- 注：做这个事情，帮助不大。因为看完之后，我发现研发岗都不太好投，数据库测试的岗位都可以投投试试。

工作最重要的三要素

自己对一段工作，最看重的三点是什么？ 从这个角度来判断自己想要什么工作：

事情：能涨知识，且有可持续性。判断依据是这个领域 1,3,5,10 年会有递增的积累。
- 为什么？这样自己有成长，随之而来会有成就感，可替代性也没那么强。
- 具体一点：这个领域的专家能让我心生敬佩。
团队：小伙伴有个人追求。不要：事事打太极；事事得过且过；无沟通交流。
- 为什么？这样方能开心的工作，能互相学习和成长。
工作时长：9-5-5 是理想型，10-8-5 接近底线。
- 为什么？迎着夕阳下班是最幸福的事情之一。回家只想躺我是拒绝的。
为什么没有提到薪资？目前生活对薪资的要求还不高。

上面的几件事还是偏理论，来点实际的例子：

✔ 如果一段工作结束之后，能结交几个趣味相投的小伙伴，想必是非常美好的。对应就是希望团队小伙伴是友善的，如果有共同兴趣和三观则完美。
✖ 工作内容一直是在解决同质的问题，比如把 A,B,C,D… 产品化。但如果是把 A 产品化进行持续优化，则不算同质。
✔ 团队能偶尔一起吃饭，能偶尔有说有笑。
✖ 团队一年到头没见过面，团队鸦雀无声。
✔ 可以在解决问题的时候获得成就感。工作内容不是可有可无的。
✖ 每天担心自己将来一天会被裁，而且找不到新工作。
后面想到再补充吧！

对测试岗位的担忧到底是什么？

对测试岗位的担忧其实有很大一部分是来“互联网行业普遍认为测试是一个技术性不强的岗位”，是一个可替代性较强的岗位。我有不少小伙伴也这样觉得。虽然我知道测试事情要做好，难度比开发可能还要高，但我自己潜意识也基本认同这个观点。为啥呢？

开发技能对比：开发 vs 测开

直观感受是：如果我把自己看作一个 TiDB 测试开发，那我的开发技能是不如 TiDB 开发。那到底开发技能哪里不如他们？

以 TiKV 存储研发为例，他们基本都熟悉存储的典型数据结构算法；RocksDB 的运行机制；都对 Raft/Paxos 算法有基本的认识；对并发编程也有一些经验；熟悉 c++/rust 编写；往往其中某一两个点会比较精通。那回头看自己，自己对这前面这些理论其实也了解，但和熟悉还是有一点差距。也就是说，我认为的_不如_，其实在于这个领域的知识掌握度不如他们，并且我没有哪一个点非常精通。（这里总他们他们的，还挺不礼貌的，毕竟我很多小伙伴都属于“他们”的范畴 :尬笑:）

测开测开，还有测试技能呢？感受明显的一个点是他们对测试（如系统测试）的要素了解不够，也就不知道如何设计一个自动化测试框架。测开其实也算是一个领域，就像分布式存储一样。那这个领域有哪些知识点？我有没有哪一个很精通呢？以系统测试框架为例，知识点有这些：系统测试用例的常见模式；常见的测试框架以及它们的优劣；环境/资源隔离；资源调度；oauth 服务；流量回放等。我精通第一个？

测开和开发岗位的共同点在于，都是掌握一个领域知识，然后需要在某几个点精通。 要想全部精通，都需要多年积累。两者差异在主要还是在于领域知识上。前者（storage），偏底层一些，参考资料基本是论文或开源系统源码。后者大都参考现有产品或框架，后者偏应用。前者单个知识点的复杂度，会更高一些。比如小白学 RocksDB 和测试框架所花的时间，我相信前者要多一些。

另外一个差异是产品品质要求。类似存储这样的产品，它的用户是实实在在有高性能、高可用性的要求的，也就是这些知识点是实实在在要用上的。比如性能，往往就体现在并发编程、和对操作系统的理解基础之上。而对于测试框架这样的产品，我的经验告诉我，它的用户往往是相对宽容的。用户遇到问题可能也只会在心里吐槽，这东西怎么这么难用，然后用户心理又想，“又不是不能用”，就这样吧。后者对性能要求一般基本没有，但易用性的要求往往会更高一些。

总结一下，类似数据库开发这样的岗位，我认为这样的工作本身就会 push 你成为一个精通的家伙，在这样的背景下，团队人才密度可能会比较高。而对于测试开发，精通和入门差异也是非常大的，是满足我自己说的三点要素的。不过要达到精通的水准，个体一定要沉得下心来，因为环境可能比纯开发要差些。换个角度说，它挑战可能更大。

测试技能

前面只聊了开发技能，如果把测试技能的因素也考虑在里面呢？

抛开对产品的理解，测试有哪些领域知识？之前合作的同事中有测试技能让我特别佩服的。我尝试结合自己经验，分析下ta的知识领域。

测试理念与测试活动：熟练知道开发流程各个阶段干什么测试活动，每个活动用到什么方法。比如需求分析评审；测试计划与策略；测试方案设计；可测性需求；缺陷分析与管理；质量度量。
测试用例设计：知道遇到不同类型的 bug 该进行什么样的测试活动，以及测试用方法。
测试综合素质：细心，不放过小问题，沟通能力强。比如对一个产品原理的求知欲；对问题的持续追踪能力；推动开发解决问题的能力。这些素质也是有前面硬核知识作为基础的。

回过头想想，在之前测试团队，有牛逼的性能专家，也有让大伙佩服的测试专家，也有 leadership 很好的老板。也就是说，这个岗位完全有潜力满足我对工作的要求。

测开专家应该长啥样？

一句话描述它：对数据库测试的一个垂直领域很熟悉：比如稳定性，性能，正确性。知道这个领域常用的测试技术，并且对测试理念与测试活动有基本了解。拆解成具体能力的话，我认为测开要精通的内容（程度划分：了解 -> 熟悉 -> 精通）

（精通）稳定性 / 性能 / 正确性的领域知识。
1. 稳定性：比如 raft 算法，选主的坑，日志复制的坑？？？
2. 正确性：比如事务；一致性（一致性的测试负载）。
3. 性能：好像每一层都有。
（精通）测试用例编写框架的设计。见识更多的测试框架，有丰富的 API 设计经验。
（熟悉）提升分布式产品可测性的常见手段和实现技术。
（熟悉）测试理念与测试活动。目前只是处于了解阶段，细节不熟悉。
（熟悉）产品领域知识。目前只是处于了解阶段，细节不熟悉。
（熟悉）所需编程技能：C/C++ / 并发编程。

偏基础设施的测开要精通的内容（和基础设施专家或许已经比较像了）

读《The Log-Structured Merge-Tree》

2023-05-11T12:05:00+00:00

先唠嗑

前几天，和 lonng 聊到 “我对 xx 很感兴趣，但一直没真正上手” 的话题， lonng 说学东西没有奇技淫巧，主要就是要专注，一次做好一件事。后来又说到一个话题， “科班和非科班”，聊了聊，感觉非科班确实不能作为不沉下心来的接口。中间好像还聊到，机会是留给有准备的人的，而不是给一个机会让你去准备。嗯，都是通俗易懂的道理。

今天偶然又看 manateelazycat 写了一篇关注的文章。嗯，他们说的都挺有道理的。 lonng 还说很多人都无法直视自己的缺点。嗯，我觉得也挺对的。

我以前觉得“分布式”很牛，但工作来、工作去，也不知道它牛在哪。去年体验了一年，对这东西更加怀疑了，真的很 interesting 么？回想到专注+奇技淫巧的话题，自己好好学习可能就是最好的‘捷径’。

论文从这里开始

读这论文以及相关资料给我印象比较深的感受是

论文里面描述的 LSM-tree 和我平常所听说的大不一样，memtable,sstable,compaction, 这些概念在这个论文里面根本不存在，但确实又能找到它们一点影子。后来看了《LSM-based storage techniques: a survey》这篇论文后，对这个问题有了更好的认识。原来大家嘴里的 LSM-tree 都是特指当代的一些具体实现。
学习了一些看存储产品的常见角度
1. 有哪些常见的角度来评价一种磁盘数据结构呢？最佳工况是什么（负载）；性价比（性能）；并发控制（concurrency control）; 数据恢复（recovery）；可调性（tunability）。（这里不得不感叹一下，很多人都会抱怨 TiDB 性能不好、或玄学调参，但可能不会把这个作为一个评价数据库的角度，tunability 是个不错的发明。）
2. 这篇论文建了一种数学模型来分析了磁盘数据结构的性价比（优势）。然后用这个模型来对比 LSM-tree 和 B-tree（或其他数据结构），有理有据。
3. 性能分析的角度：I/O 成本、数据温度（Data Temperature），multiple-page block，这几个分析角度值得记住。不过，我也没有看这个分析的细节，以后有需要再来吧。
4. 多看论文，可能以后就不会好奇：这人竟然还能从这个角度想问题！
大部分东西的产生都是需求导向的，论文在一开始就介绍了 1996 年那个时候需求的变化，从而促使了他们研究了 LSM-tree 这样一种数据结构。有点哲学意味。

LSM-tree 是什么？

LSM-tree 全名 Log-Structured Merge-Tree，一般直接用英文名称呼它。它是一种以磁盘为基础的数据结构，旨在为较长周期内有高频写入的文件提供低成本的索引。这两篇论文读下来，我理解，Log-Structured 的含义就在于它是顺序写的，就像写日志那样，而 Merge 的含义在于这种数据结构里面自带了一个 merge 过程，这个过程是必不可少的。论文里面原文是这样定义的：

The Log-Structured Merge-tree (LSM-tree) is a disk-based data structure designed to provide low-cost indexing for a file experiencing a high rate of record inserts (and deletes) over an extended period.

为什么要有 LSM-tree？它有什么优势？

论文在一开始就说了为什么要有这种数据结构，因为有一类负载在现实场景中越来越多。总的来说，LSM-tree 适合写多读少（就是读要有，但也不能特别多的场景）。

The need to answer queries about a vast number of past activity logs implies that indexed log access will become more and more important.

论文作者以 B-tree 作为基准来进行对比，B-tree 索引会增加 50% 的 IO 成本。论文里面花了一个章节来论述 LSM-tree 的性价比，这个论文比较费脑，我只是匆匆扫了几遍。但我发现它的分析角度还是比较值得我这个新手学习。

它先给出了一个性价比的分析方法，也就是 3.1 章节 The Disk Model。这里面分析了 I/O 成本，数据温度（Data Temperature），也说了 Multi-page block I/O 的优势。（他们把评价标准都想的这么清楚了，那设计出来的数据结构/算法肯定也就不会差了嘛。）然后它把这个方法套在 LSM-tree 和 B-tree 上。它在第二章的时候还提到了 The Five Minute Rule，这个 rule 阐述了什么样的数据应该被缓存，也挺好玩的。分析过程看起来还是有理有据的，它算是对性价比建模了。也就是这个过程比较费脑，我先跳过了。

LSM-tree 的基本工作原理，LSM-tree 一些有趣的细节？

LSM-tree 有三个特点。论文里面的第二章也介绍了这种数据结构是怎样进行增删读写的，还介绍了它的 rolling-merge 流程。根据 a-survey 这篇论文的说法，它的 rolling-merge 和当下大家所说 level-merge 是比较相似的。

通过 defer 和 batch 来低成本维护实时索引

The LSM-tree uses an algorithm that defers and batches index changes, cascading the changes from a memory-based component through one or more disk components in an efficient manner reminiscent of merge sort.
减少磁盘臂移动来减少 IO 成本

The algorithm has greatly reduced disk arm movements compared to a traditional access methods such as B-trees, and will improve costperformance in domains where disk arm costs for inserts with traditional access methods overwhelm storage media costs.
适合写多读少（在介绍部分又强调了一次）

However, indexed finds requiring immediate response will lose I/O efficiency in some cases, so the LSM-tree is most useful in applications where index inserts are more common than finds that retrieve the entries.

读《The Log-Structured Merge-Tree》

我读这一篇论文的主要目的主要是看看 memtable, sstable 这些概念是从哪里引入的。因为我看 LSM-tree 的论文上根本没有提到这些概念。这篇论文的第二章 LSM-tree Basics 是我阅读的主要重点。它分两节，一节将 LSM-trees 的历史，一节讲现在的 LSM-trees。

LSM-trees 历史

Update 方式可以分为两种：in-place 和 out-of-place。

In general, an index structure can choose one of two strategies to handle updates, that is, in-place updates and out-of-place updates.

out-of-place 中的一种典型是 LSM-tree。它的好处是利用顺序 I/Os 来处理写入，它对于恢复（recovery）也是更有利的。但是这种方式的读性能被牺牲了。并且，它需要一种额外的数据组织过程来提升空间和读取效率。

This design improves write performance since it can exploit sequential I/Os to handle writes. It can also simplify the recovery process by not overwriting old data. However, the major problem of this design is that read performance is sacrificed since a record may be stored in any of multiple locations. Furthermore, these structures generally require a separate data reorganization process to improve storage and query efficiency continuously.

这种顺序，非原地更新的思路很早就有了。看完这句，我似乎明白了 log-structured 的含义，因为 log 也是顺序往后写的。

Later, in the 1980s, the Postgres project [65] pioneered the idea of log-structured database storage.

在 LSM-tree 之前，这种 log-structured 的存储主要有几个问题。最重要的就是读性能问题，因为相关的日志条目被打散了。另外一个是空间浪费。尽管有各种各样的数据重组织过程，但没有一个很 principled 代价模型来分析这里面的 trade-offs，这让调优变得非常困难。

LSM-tree 算法里面自带一个 merge 的过程，这种设计在现在通常被称为 level-merge。

However, as we shall see later, the originally proposed rolling merge process is not used by to- day’s LSM-based storage systems due to its implementation complexity.

后来又有人设计了新的 merge 策略，比如 tiering-merge policy，有更好的写入性能。

当代的 LSM-trees

当代的实现和论文里面写的 rolling merge 过程有些不同，简化了并发控制以及数据恢复。

However, today’s LSM-tree implementations commonly exploit the immutability of disk components to simplify concurrency control and recovery.

当下的 LSM-tree 通常用 skip-list 或 B+-tree 来实现内存结构，使用 B+-tree 或 SSTables 来实现磁盘结构。

有两种 merge 策略当下比较常见: leveling merge 和 tiering merge。

Two types of merge policies are typically used in practice.

当下 LSM-tree 一些典型的优化手段

Bloom Filter 支持两种操作，插入，以及测试一个key在不在（会假阳，不会假阴）。它可以大幅提升点差性能。当下的常见调优配置中，假阳概率通常 1% 左右。

Partitioning 应该可以理解为每一层是由多个 SSTable 组成，而不是一个。

Concurrency Control and Recovery 有加锁和多版本这两种模式。多版本模式在 LSM-tree 上工作良好。并发 flush 和 merge 的实现通常和 LSM-tree 具体实现相关性较大。由于这些操作会修改 LSM-tree 元信息，比如 SSTable 列表，所以这些操作需要非常小心的同步。引用技术策略可以较好的防止一个正在使用的组件被删除。

为了简化恢复过程，现存系统通常采用 no-steal 缓冲区管理策略。也就是，只有当所有的写事务都终止的时候，一个内存组件（memtable）才会被 flush。所以恢复时只需要做 redo，而不需要 undo。对于分区的 LSM-tree，恢复时还依赖“存储了 LSM-tree 结构变更的” metadata log。

其它一些有趣的内容

这篇论文后面还把 LSM-tree 的优化手段进行了分类。读放大，merge 策略，硬件适配，特殊负载，自动调优（调节阀太多，人很难调），二级索引。

未来的研究方向里面说到，目前还没有人给这些 DB 做一个“全面的性能评估”，这里还提到一个词 tunability，TiDB 其实也有这个问题，参数太多。

It is not clear how the improvements would compare against a well- tuned baseline LSM-tree for a given workload. Moreover, many of the improvement proposals have primarily evalu- ated their impact on query performance, with space utiliza- tion often being neglected.

后续

下面去学学 B+-Tree 吧。

自驾 G318

2023-04-12T09:14:00+00:00

现在是 2023-04-12，我正在为了写，而写这篇“博客”，真不知道要记录些什么。在 10 分钟之前，这篇博客的标题与现在还有点不一样，叫做“自驾 G318”，但对着标题看了十分钟，我真不知道该写啥好。于是我机智的换了个标题，果然，这废话不就来辽。

现在是 2023-04-26，我，听了蓝莲花，“文思泉涌”。两周之后，之前的恍如隔世感觉消失得无影无踪。回顾一下之前写的内容，有点把自己的角色局限在某个身份，并且思考的内容过多，旅行本身则太少。这次在悠扬的歌声中，补充完了“我们的歌”和“在 G318 上开车”两个章节。自我感觉这流水账架势不错。或许标题将来应该改回“自驾 G318”。

G318

想来想去，这故事还是得从 G318 开始说起。

大家口里的 G318 通常指“G318 的川藏段”，它被誉为“中国人的景观大道”，旅行者们也常说“318 此生必驾”。

川藏线318，无数人终其一生都想去的彼岸。我国境内八条进藏线路中，318是距离最长、历经地区最多、基础设施和补给也最成熟的一条。几乎每百公里就会有加油站，对车型的要求也不高，甚至你不太心疼的话，轿车都可以。但对驾驶技术的要求很高，途中多个海拔 4000 以上的垭口会让你切实感受到什么是一天有四季。

以怒江72拐为代表的众多盘山公路和路边的万丈深渊，会让你明白为什么人要心存敬畏。但当你穿行于藏东的高山峡谷，跨过金沙江，澜沧江，怒江和雅鲁藏布江，翻过念青唐古拉和岗底斯山脉，这些教科书里的名词如此具象的出现在你的眼前，你亲身感受了他的壮美。你会明白，旅行，就是用脚步丈量世界，用阅历填补人生，你读过的书和走过的路都不会辜负你。

— https://baijiahao.baidu.com/s?id=1700243895558155224

上面这段文字是我读到的最复有“感染力”的一段了。看了有木有想去走走 318？

为了找到一段合适的318介绍词，我还特意花了68RMB去买了“中国国家地理”2006年第10期，然而它一段像样的描述也没有，有点气！要补充的是，318 也不止惊险和壮阔，还有草原、冰川、森林、野花、海子、雪山、温泉等迥然不同的景象，美到极至，触目可及。多样的民居式样、服饰衣着、民族风情、语言乃至信仰标志，更是让旅行者沉浸在一个丰富多彩的民族走廊里。走进西藏，了解布达拉宫和大昭寺等相关历史，对“我国是一个统一的多民族国家” 这句话就会有更深的理解。

‘04-12 的我’的 G318 之旅

不知道3年后看到这段文字，自己会是怎样的体会呢？

这次旅行让我最开心的是我成功的“贴贴”了每位小伙伴。然乌湖是这趟旅程我觉得最棒的景点，没有之一。也是在这里，完成了贴贴小目标。这一路虽然美景不断，但气候宜人的点可真不多，除了然乌湖，其它基本都是或风吹日晒，或冰雪交加的。贴一张最喜爱的小照片（虽然人还不是很齐，但笑的很整齐！）

这次行程有 7+4+4 位小伙伴，人数还挺多的。一个中巴车（一个额外的司机师傅负责驾驶），两辆 SUV。其中有 4 位小伙伴是从昆明出发，走滇藏线，大部队在芒康汇合。

说 318 之前，不得不说到去年和其中两位小伙伴的川西小环线，我们一共三人，一辆大众帕萨特，3天半走“达古冰川 - 黄龙 - 九寨沟”这条线，这躺自驾游给我最大的印象可以用两个字来形容：“难忘”。难忘的点挺多的，最难忘的还属在因疫情原因（黄码）被松潘疾控中心叫停，在疾控中心免费住了一晚，第二天中午成功的去了黄龙，梦幻般的体验；其次就是每天赶路到半夜 9 点，惊险又刺激；然后大概就是在红原大风暴雪中狂奔、以及初入藏区，身边各种新鲜事物层出不穷带来的惊喜，比如路边有人招手千万不要停等“轶事”。九寨沟的景色其实也不错，不过相比起来九牛一毛。

现在回想，难忘的原因大概就是每时每刻都是“新鲜”的“刺激”。今年行程结束，体感差异还挺大的，今年最大的感受是“恍如隔世”。纪录这篇博客的原因也是想好好记录下这个行程以及这个感受。 2023-04-27 来更新一下，记录博客的原因多了一个，那就是：有感而发。嘻嘻。

今年行程和去年最大的相同点，给人感觉就是“肝”了，去色达佛学院的那天半夜三点起床，然后在佛学院的观景台上站了两个小时，就等太阳出来，还不是日出的那种。4000 海拔，现在想想都觉得冷。关键是前一天晚上11点我们还在和师傅“讨论”行程，睡眠就3小时，第二天还要赶 400 公里，开车全靠意志力，挺那啥的。幸运的是，有小伙伴觉得色达佛学院这趟很值，我觉得他们是有真信仰的。第四天行程更是开车到凌晨1点，晚饭都没来得及吃，到地直接躺。但怎么说，其实并没有去年行程赶，23333

一个适合最后再看的人生难题思考

感悟集锦

2022-03-20T10:06:00+00:00

最近感悟很多，一定要记下来！

任何时候都要知道主线任务是什么，并尽力完成它

2021 年，在工作中，有短暂尝试“带”一群小伙伴做一些事情，是一段不错的经历。个人感觉做的很不行，不过也学到了许多东西，其中最重要的领悟就是这“第一条”。

在生活中，脑袋中经常浮现很多问题：

房子买了没？还摇号么？买房是坑么？
最近去哪玩比较好呢？
摩托车驾照考试还只学了第一节课？
周末干点啥呢？要不来几局 LOL？
今天要不要自己在家里做个饭？
《置身事内》还有两章没看，总结也没有写？
到底要找个什么样的人一起生活呢？
我的职业规划是啥？
周末要不要去运河边上走走？
好无聊啊，要不刷刷视频？
太瘦了，一定要健身！
周杰伦为啥如此强？
…

2333，问题可太多了。烦恼的时候如果能找到主线，幸福感就很高。不过，找主线这事本身也不容易。

内向完全 OK，真诚才是王道，同时要懂得拒绝

自认为是个偏内向性格的人。被这个问题还是困扰了挺久的。之前觉得是“内向”耽误了很多事情，甚至觉得内向的人往往交不到朋友，做不了 tech-lead/manager 等等。

但。交朋友最看重的可能是真诚。专业能力和 leader-ship 才是工作中最重要的素质。内向的人也完全可以具备良好的 leader-ship。当前确实感觉外向的人更容易把这件事做好，但这应该是“外向”和 leader-ship 的某项能力要求是重合的。

自己在“懂得拒绝”这点上，做的还是挺不够的。

Tech Lead 这回事

理论版

梳理团队主要方向（最重要的 1-3 件事是什么 -> 专业能力）
和团队成员达成共同愿景（把方向同步给大家，并达成一致 -> 热情，感染力）
及时发现并解决前往目标过程中遇到的问题（-> 专业能力）
人才管理（人尽其才；薄弱点及成长计划）
技术上深入，扩展视野（解决问题；业界怎么做）

实践中可以思考的几个问题

主方向和边界一定要界定清楚。
带实习生和带小组的区别是什么？比如目标以及事情的跟进、参与粒度。
融入项目，和大伙一起干，技术与管理不能割裂（对比纯管理）。

和小伙伴旅游这件小事

志同道合 是真理。
贴贴是旅游的灵魂，惊险刺激的旅游不需要贴贴。
成熟的旅行者让人踏实，“不成熟”的伙伴让人开怀。
松耦合，高内聚，万物可互联，应该是最佳实践吧。
大家好才是真的好。

给 FeelUOwn 设计合理的 DSL - 简单考古 shell 的词法分析规则

2022-01-21T14:47:00+00:00

一点背景

音乐播放器 FeelUown 向外提供了基于 TCP 的 RPC 服务，该服务提供了控制播放器的接口。这些接口可以让使用者控制播放器的播放、暂停、搜索等功能。用户可以使用 telnet/netcat 连接到服务端口，输入相应的命令文本来调用这些接口；也能够通过 fuo 命令行工具来调用。但怎样让命令文本和 fuo 命令行有一个统一的使用方式呢？

困境

在当前的设计中，命令文本和 fuo 命令行的使用方式存在不一致。举个例子，在 netcat 中输入如下文本可以实现“从关键字‘周杰伦’从网易搜索符合要求的歌曲，并以 json 格式返回”

search 周杰伦 [source=netease,type=song] #: format=json

使用 fuo 命令需要输入如下

fuo search 周杰伦 source=netease,type=song --format=json

当前的设计是否合理？怎样修改才能让两种更加统一呢？带着这两个问题，我决定先看看 shell 是怎样解析命令行文本的，了解它有哪些拓展的可能性。要知道 shell 如何解析命令行文本，我觉得可以先看看它的词法分析是如何实现的。我找到两份资料，一份是 shell 的详细说明文档；一份是名为 shlex 的 Python 标准库。

探索

Shell 的 token 识别规则

规则细节参考 Shell 详细说明文档的 Token Recognition 章节。 Token 识别一个重要的内容是明确 token 与 token 之间的分隔。从规则细节中，可以发现 token 的分割符是空格（）。而 token 的首字符有如下几种：

io_here 的标识符
操作符或单词的首字符
引号和反斜线（quote, ）
表达式标记（$, `）
注释（#）

Python shlex 库如何模拟 shell 的解析

影响 shlex 与常见 Unix shells 的兼容性的参数主要有四个：wordchars, punctuation_chars, posix 和 whitespace_split。

wordchars 的默认包含所有的 ASCII 字母数字（ASCII alphanumerics），以及下划线。 punctuation_chars 设置为 True 的时候，~-./*?= 这些字符也会包含在 wordchars 集合内。而 ();<>|& 这些字符则会被解析为单独的标记（token），posix 为 True 时，拉丁语的重音字符也包含在 wordchars 集合内。

不难发现，wordchars 相当于一个白名单，punctuation_chars 则相当于一个黑名单。在白名单内的字符都会被当做单词中的一个字符，而在黑名单的字符都会被解析成一个单独的标记。 posix 参数是通过改变这个白名单来间接改变 shlex 的行为。而当 whitespace_split 为 True 时，shlex 完全忽略白名单。

总的来说，为了让 shlex 尽可能模拟 shell 的行为，可以打开如下

>>> import shlex
>>> s = shlex.shlex('cmd x y z --o1=o1 --o2 o2?',
...                 punctuation_chars=True, posix=True)
>>> s.whitespace_split = True
>>> list(s)
['cmd', 'x', 'y', 'z', '--o1=o1', '--o2', 'o2?']

当然，这并不等同于 shell 的解析行为，从 shell 的详细说明文档中可以看到， $\\"'\` 这几个也有特殊的处理方式。举个例子：

>>> import shlex
>>> s = shlex.shlex('cmd x y z --o1=o1 --o2 $o2',
...                 punctuation_chars=True, posix=True)
>>> s.whitespace_split = True
>>> list(s)
['cmd', 'x', 'y', 'z', '--o1=o1', '--o2', '$o2']

而 shell 会把 $o2 识别为一个变量，并在运行的时候进行替换（substitution）。

关于 ASCII alphanumerics 根据维基百科记录，在 POSIX 标准中，它定义如下： In the POSIX/C[2] locale, there are either 36 (A-Z and 0-9, case insensitive) or 62 (A-Z, a-z and 0-9, case-sensitive) alphanumeric characters.

因此，我们可以看到很多语言的词法分析器会有类似如下的正则
re.compile(r'[a-zA-Z0-9_]')

结论

刚脑袋实在转不动了，于是去洗了澡澡。我就在想啊，为啥不直接复用一下 shell 的格式呢？百利而无一害吧。好，又水了一篇博客，水总比不写好，嘿嘿。