万物皆可数据,万难皆可分析

2021年8月,吕思雨从天津大学计算机科学与技术专业毕业,入读GTSI数据科学硕士项目。当年是该项目落地GTSI的第一年,融合了佐治亚理工工业与系统工程学院、商学院、计算科学与工程学院的课程体系,力图跨学科培养学生将“数据转化为信息,信息转化为决策”的能力。
经过1年多的学习实践,数据科学的思维模式已经逐渐内化为吕思雨的方法论。在充满复杂性与不确定性的世界里,她习得了对数据的敏感性,进而能够运用所学整合繁复信息,解决具体问题。这也是她一直以来想获得的能力。
“八皇后棋盘”与城市安全地图
“一开始,我比较想学的其实是偏商科的专业。”吕思雨说。
2017年,她高考出分,第一志愿填的是工业工程,第四志愿是计算机科学与技术。
“当时计算机还没有现在这么火爆,而我一直想往公司业务的方向走,想进入企业和商业运用领域,对计算机和代码倒不是很感兴趣。”
结果,她第四志愿上线,在代码、算法和各种汇编语言里浸泡了四年,虽然掌握了很多概念、工具,但对计算机专业依然没有产生热情。
“本科阶段我学到了有用的东西,却缺少机会去应用和实践,导致知识往往停留在概念层面。”比如,在课堂上花大量精力学习回溯算法,解出的“八皇后代码”一旦跳出1848年马斯克·贝瑟尔的假想棋盘,便不再能带来现实意义上的成就感。
这种落差让吕思雨重新思考起未来的发展方向。而一次参赛经历,帮她找到了出口。
2019年5月,吕思雨和同学组队参加全国大学生创新创想大赛,想开发一款精细化城市安全电子地图,用于说明天津市内不同时空发生的案件情况。
开发过程先从原始接警数据开始。他们对接警数据中心的案件描述进行语义分析并提取主题词,再使用百度地图API绘制电子地图,从时间和空间两个维度对不同街区的安全程度进行评估。
由于技术能力不足,城市电子地图最初设想的功能没有完全落地,但依然是吕思雨本科期间参与过“最完整,最有现实意义的一个项目”。
沉寂的学习热情被运用知识解决实际问题的既得感点燃。吕思雨认识到数据背后隐藏着很多信息等待发掘,继而对数据科学产生了好奇。临近毕业,当GTSI数据科学专业启动招生的信息进入眼帘,她知道,机会来了。
不论是跨学科的教学方式还是项目本身全美领先的专业排名,都十分契合兼具计算机专业背景和商业管理兴趣的吕思雨。她很快准备好所有申请资料,并顺利通过筛选。
几个月后,吕思雨拖着行李箱,从北洋飞到岭南,成为GTSI数据科学硕士项目(MSA)的第一批学生。
实践中锻炼“敏感”的能力
“在GTSI学数据科学难不难?”
“挺难的。”吕思雨秒答。
数据科学硕士学制需要学生修满36个学分,包括5门必修课、5门选修课,以及价值6学分的Applied Analytics Practicum。后者要求学生进入企业,运用数据科学知识帮助企业解决问题。
“课程上的学习虽然也注重应用,但更多基于案例,给我们处理的数据通常不存在太多干扰项。”走出课堂,数据科学从业者则必须具备足够的数据敏感性,才能识别和剔除芜杂数据池里大量存在的干扰和噪音,解决真实世界中的复杂问题。
数据敏感性与实践强相关。认识到这一点后,吕思雨抓住校内项目和校外实习的每个机会,努力锻炼数据敏感度。她印象最深的,是疫情期间和同学们一起做的核酸检测点分布优化项目。
当时,深圳执行着较为严格的疫情防控措施,市民核酸检测频率高,部分点位经常出现拥堵,但也有空闲点位长时间无人前往。吕思雨和同学们想到,如果结合人口密度数据对核酸检测点的分布进行优化,可能会使点位设置更加合理。
于是,以百度地图开源的深圳市人口密度数据为基础,他们根据城市区划图对巨量数据进行切割,降低了运算难度,然后将地图网格化,用一个坐标点代替一个网格内的所有人口,进一步减少计算量。
此时的数据相比最初已经大大精简。吕思雨和同学们接着运用课程中学到的排队论建立优化模型,使用模拟退火算法寻找最优解,最终形成的结果在Tableau中实现了交互式呈现。
安排核酸检测点位的决策者可以根据不同点位的分布位置,预估对应点位可容纳的检测数量,以及需要的医护人员数量;有检测需求的使用者也可以看到每个点位的预估平均等待时长,作为选择检测点的参考。
洞察现象,寻找手段,解决问题。
在GTSI学习数据科学的体验,改变了吕思雨大学时期对“代码”的态度。曾经明确表示对此“不感兴趣”的她,现在将代码视为处理数据的趁手工具。
她不仅从零学习了数据分析常用语言如Python、R、SQL,也在数据结构算法和机器学习算法上更加深入地钻研,积极寻找数据集演练所学模型,思考数据分析思路的展示方式。
在一家主打移动出行平台的互联网公司实习期间,她将平台司机半年内的流动数据分类整理,自学运用Python绘制桑基图,将看似复杂的流动规律,清晰美观地呈现出来。项目成果令人满意。
这项成绩也在吕思雨的校招面试中被企业方圈出,作为体现她个人能力的一个亮点。
不知不觉间,GTSI两年充实的学习结束。吕思雨已经抵达她本科时所企望的业务层面,能够灵活运用技术,兑现商业价值。
把自己作为问题,在经验中优化路径
故事讲到2023年春天。
吕思雨结束了校招的战斗,收获是普华永道、华为和平安产险三份offer。
三家公司都看重她的计算机专业背景和数据分析能力,这在IT咨询、业务分析、企业管理与统筹的职业发展路径上是优势项。
“其实最开始我也海投了很多不适合的岗位,浪费了一些机会和时间。”回看求职经历,吕思雨的优化思路是早一点结合专长明确方向,“这样可能会有更多选择。”
好在结果是令她满意的。华为提供的培养模式、平台基础、学习空间,当然还有薪资待遇,最符合吕思雨现阶段的期望。大量的芯片测试数据,也让她的能力即刻就能得到施展。这成为她最终的选择。
“我计划先在好的平台稳定工作一段时间,积累经验,提升能力,再搞清楚自己下阶段想要什么。”
至于坊间围绕大厂“内卷”和“35岁辞退”展开的激烈讨论,对吕思雨来说更像数据池中的干扰项,并不会影响当下的思路。
此刻,吕思雨已经搬去东莞,在华为投资100亿建设的松山湖小镇租住。两周后,她将正式入职芯片测试工程师的岗位,在这家以“狼性文化”著称的公司,即便是新人,工作压力可能也不容小觑。
但个人职业发展路径的摸索,和公司业务流程的调整一样,需要持续的数据支撑作为分析依据。
把数据科学专业赋予的思维模式,作为解决生活中各类问题的方法论。从GTSI走出去的吕思雨,将持续运用所学,选择、建立、解决、分析她的成长道路。