/首页
/开源
/关于
尚隐篇:幸福的时光(下)
发表@2018-10-31 22:51:34
更新@2023-01-21 22:47:40
其实有件事情是不得不说的,其实自从临时定都尚隐二楼后的长达近乎两个月的时间内,产品是没有大更新和迭代的,因为看起来也没人管,好不容易有人管了但这个人又不爱来,一直到后来找找入职才稍微好转。 在这期间,只有服务端的基础设施架构也往前演变推进了些许。 产品没人管这件事可以往前追溯到一个bug或者说设计不合理的地方。玩过GM APP的人都知道,APP有一个叫做“谁赞过我的功能”,这个功能是按照天分页的,打开进来后你会看到最近10天一共有多少人赞过你。本来,这个功能在初期是没啥大碍的,但是后来,用户多了,狼多肉少了,如果一个5分女咔咔一顿自拍美颜到7分,然后注册GM操作一波儿,一天搞到3000个赞是妥妥没问题的,但问题来了:如果10天内,该女性用户平均每天都能搞到3000个赞,那么一共是30000个人。也就是说,在打开界面的一瞬间,需要一次性获取3万个人的信息。如果有很多这样的女性用户,那就是灾难,然而事实是,GM真的有很多这样的女性用户,因为在GM上,只要是个女的就会无数男的跪舔。 卡,非常卡,极度地卡顿,所有的用户都在卡。 “傻逼啊,放到redis啊!”,“傻逼,我早放redis了!”,“放redis了还这卡?”,“妈蛋!redis架不住流量大啊,这一台redis服务器QPS已经突破5万了,redis也不是万能的啊!” 一开始大家的反馈就是卡,白天还行一到晚上22点到第二天凌晨1点期间卡。部门收到反馈后开始排查,期间很多人都在催促,不少人都建议我升级服务器,然而我不爱升级服务器,因为在故障确认前不能下结论就是因为服务器配置到达极限引起的,万一升级了服务器还是卡就是一个很尴尬的问题了。 我通过打点时间确认就是因为“谁赞过我”这个功能引起的。不能说是代码垃圾,也不能说redis不行,这是典型的APP设计上的不合理引起的问题,因此最终解决方案就是修改设计:将单天收到的赞数进行分页,不再获取某天全部的赞。 但,晚上是不能卡的,临时解决方案就是在其他人的见一下盲目升级服务器。 事实证明,盲目地升级服务器果然是浪费金钱和打脸的,所以只能修改原有的脑残设计。 从发现问题到分析问题再到确认问题期间,一共用了1-2天时间(实际上关键时间也就1-2个小时),这期间无数人都在催促,表现地无比焦急,舍琳娜还让我分别用电子邮件以及书面报告两种方式分别进行汇报,我在一种很反感地心态下分别用打印机打印了一份书面材料同时又用电子邮件群发了一封相同内容邮件。 从理论上讲,引起这个问题原因就算是正式传到到高层了。 从理论上讲,我认为高层的人应都已经知道是什么问题了。 然而,我还是太年轻了... ... 实际上,再确认了问题后,UI设计豌豆女士开始着手修改了,于巨蛀也做好了修改APP的准备,服务端API也做了相应准备。然而,就这一个页面的设计图,本来一天就可以搞定地事情,过了三天还没修改好,说句不太好听的,反正公司和项目也不是老子的,你们爱改几天改几天。 又过了好几天,一直到后来的某天晚上大概十一点,技术部群里舍琳娜突然发了一个“谁赞过我”那页的截屏,大概意思就是“我一点到这个页,就非常卡,半天不出来”。当时我就急眼了,开始在群里骂娘,骂到后来舍琳娜开始给我打电话。 我骂有两个原因: - N天以前,老子用书面报告和电子邮件两种方式汇报了卡顿的原因,现在,你又出来问。 - 卡的时候一群人表现出焦急催促,区区一个界面改了MB快一周了,MB到底是急还是不急? 舍琳娜打来电话只有一个原因: - 解释为啥会在群里发这个截屏并委婉表达自己的无辜。 这个问题终究是在一周后才得到了解决,呵呵哒。 不过这件事情直接推动了我们redis集群的上线,在此之前,则是一直在用redis主从强撑。然后我们在横向评测了普通的主从结构、twemproxy、codis后,终于选择了codis,而官方的redis cluster直接放弃治疗。当时二营长弄了几台后付费的服务器研究了一个白天,部署上了上去codis,主要机器构成如下: - 一台集群的proxy - 三组机器,每组两台,一主一从。每台机器都是2核8G,之所以能买到这么畸形配置的云服务器,因为当初我从百度云那里争取过来的一个特权,就是可以允许自定义配置 所有,整个集群就提供了一个24G的缓存,而且还可以十分方便的加入新的机器进来扩充容量! 下面是codis控制面板的一些截图,信息已经脱敏: ![](https://ti-node.com/static/upload/6431497795940646912) ![](https://ti-node.com/static/upload/6431710111290359809) ![](https://ti-node.com/static/upload/6431710173311533057) 然后,紧接着,二营长又部署了zabbix监控: ![](https://ti-node.com/static/upload/6431710362038435840) ![](https://ti-node.com/static/upload/6431710418497961985) 其实这段时间,舍琳娜也学鸡贼了,也学会如何与这种公司的部门相处了。确切说跟我的关系也缓和了许多,从一开始的彼此骂傻逼,到后来的语重心长地说道,再到后来在群里给我发“JB烤串”的小表情。 这段时间,在历经了前面的动荡和撕逼后,公司总算沉淀下来了,氛围空前的好,我敢说,这是GM史上“前无古人,后无来者”的融洽氛围。部门之间没有过多的隔阂,也少有撕裂,至少大面上都是过得去的。技术部也通常都是主动到8点左右离开,离开后要么是去组局儿,要么就是简单吃个饭集体走路到望京南地铁站。 这期间不得不说的穿插了两件小事儿,也挺好的。 一是据说在舍琳娜的撺掇下,GM终于迎来了史上第一次公司内部小聚会,由头是员工的生日会。我认为这很好,用舍琳娜的话就是促进并活跃一下公司氛围。然后就是一坨人绕着桌子吃吃喝喝,最后在舍琳娜的提议下,还要一起玩个小游戏之类的,诸如杀人游戏之类或者谁是卧底之类。总之,看起来还是不错的。游戏玩到后来我就烦了,采取的策略就是颠儿,颠儿到楼下小花园。如果我没记错的话,我下去的时候张大彪正在那里客串园丁,弄了个水管子浇那些花花草草。 二是人事Maggie的离职。这件事情大概是这样的,有一天中午,忘记是毛方方还是张大彪了,突然在楼下偷偷摸摸跟我说“你知道么,Maggie要离职了!”,当时的场面你可以想象一下农村的大妈们在一起偷偷摸摸说隔壁家结婚五年没孩子的时候那种,然后接着说“今天我在楼下抽烟,问她人招的怎么样了,人说了一句去他妈的招人,管我什么事”,紧接着继续分析“你想想,这种话都说出来了,肯定不打算在这里干了”,我说“分析地在理!那啥时候走啊?”,“说是大概月底吧。。。”,“那怎么以后得对人家好点儿”,“嗯,是的”。。。 。。。 欢乐时光总是短暂的。这段持续了约不到一个月的黄金期终将走完,因为,GM准备迎来他的第二次搬家了,离开这个小庄园的二楼,去798的另外一个地方,在那里,新的故事和传奇继续将继续持续。