数据工程师在办公桌旁搭的行军床
“我们只能分清白天黑夜,没有其他的。”高勇波说。
防疫指挥部的第一步工作是要快速地把这些数据汇聚起来。邓华亮向Tech星球(微信ID:tech618)说道:“汇聚起来以后,发现数据标准不统一,数据质量也参差不齐。然后接下来的工作就是,抓紧把这些数据都整理好、清洗好”,这无疑是一个工作量巨大且高强度的事情。
随着确诊人数不断激增,23日上午十点钟武汉封城。全国最关心问题是,武汉到底外流出去多少人?去了哪,乘坐什么交通工具?每日的数据每日结清,每日的数据中各类关注对象信息都要当日上报。这些原始的一手资料,只能由武汉团队第一时间进行归纳,相比较其他城市的防疫,武汉的工作量都是乘以百计、千计、甚至万计。
邓华亮说,“掌握了外流人员信息后,我们利用大数据建模手段,构建了上百个分析模型,有数据真实性的交叉验证模型,有落地确诊病例模型,有外流人员去向查找模型,有密切接触人员身份落地模型等等。然后把这些模型的分析数据推送给一线防疫人员,抓紧去落地核查。可以说一个模型就是一个战场,每个战场都关乎生死。”
临时团队人员少,在巨量的数据处理信息面前,难免会出现各式各样的问题。“因为是多部门、多系统向一个地方汇集,又从一个地方向外发送,相较于技术支撑的难度,在整个分析运行的协同机制上可能会存在更多的问题,每天除了解决技术问题,更多的时候我们还要跟不同的部门进行沟通,提醒数据上报,询问接受反馈,确保工作顺畅进行。机制运行之外,就是不断地完善算法和功能,尽可能的压缩技术处理的时间,每压缩一点,就有更多的时间去处理更多的问题。”许珂向Tech星球解释。
由于武汉交通管制,海致北京总部的技术人员无法到达武汉现场,但为了能够保证及时协助武汉的团队,技术同事们24小时在线,远程帮忙排查解决问题。
1月30日,公司紧紧协调增援3名技术骨干进驻武汉,进行轮岗。同日,海致为全国2.2万名一线疫情防控人员,紧急开通了内网大数据分析平台账号,免费支持服务一线疫情防控数据分析。随后,从南昌、南京以及湖北很多正在被封闭的村镇,十几位海致工程师在短短几天内向武汉、孝感、黄冈、鄂州等疫情前线集中。
一道大数据防疫城墙建立起来。
火线增援总攻
大约一个月的时间,9位工程师连轴转,最终武汉的疫情防控数据模型逐渐稳定,“接下来要支撑湖北其他的地市,本地工程师人手已经不够,只能从总部抽调人过来。”高勇波向Tech星球说道。
研发总监翟士丹介绍,“我天天都在和勇波电话,既害怕又期待,害怕的是系统临时出现了什么问题,耽误了分析,期待的是按照前方要求新上线的功能,能带来救人的好消息。就这样,有时一晚上都睡不好,就想着能从哪儿下手,做的更好一点。”
2月19日,武汉全面启用12家方舱医院,医疗资源得到缓解后,武汉疫情防控战役发起总攻,数据量倍增。应武汉疫情防控总指挥部要求,再次紧急增派数据分析师,火线支援。连明、张顺民宋彦朝三位“数据侠”主动请缨。
连明是北方区负责人,常年在北京办公。2月18日晚上8点,下班后的连明接到公司副总裁的电话。“武汉这边的兄弟已经连续作战30天了,为了保证大家的身体健康,我们得向医护人员一样强制替换,需要你现在支持武汉的疫情防控工作,明天清晨出发,OK么?”突然接到通知的连明,直接回复“没问题,马上清行李。”
随后,连明立即通知部门同事,“紧急去武汉支援,有没有问题?明早出发。”大家都没有任何迟疑。2月19日早上7点左右,连明与同事相约来到北京西站,往日人头攒动的西站只有零星的乘客,各自相隔很远。
7点26分,三人坐上了由北京开往深圳的G71高铁。武汉封城后,G71便不在武汉经停,但当听闻是派往武汉的支援人员时,武汉有关部门提前沟通,协调武汉站特批G71可以临停武汉。
海致公司制作的智慧大屏效果图
正如谢尔曼・斯坦因所阐释的,数学化远不止是“一堆数字的计算过程”。“当在一个突发的、超级复杂,不断动态变化的过程当中,如果没有大数据,就没有办法支撑决策,这时候大数据成了决策的本身”,杨娟对Tech星球(微信ID:tech618)说道。
疫情爆发后,互联网科技公司都纷纷利用自己的大数据技术能力,快速地投入抗疫之中。
1月21日,丁香园推出了“疫情实时动态”信息页面;22日,微信上线疫情实时搜索功能;23日,腾讯健康和百度地图同时上线“发热门诊地图”,推出了百度迁徙数据,腾讯看点上线“战肺炎”频道和“关注肺炎”专题,以及疫情地图和预防手册;阿里达摩院研发AI算法,将原来数小时的疑似病例基因分析缩短至半小时,大幅缩短确诊时间。
“战疫”接近尾声,但尚未结束。一线战斗岗位仍需坚守,在这场“人命关天”的争夺战中,大数据工程师们担负了重大而特殊的使命,保卫了许多人的健康。