个人简介
杜克大学统计科学硕士
加州大学戴维斯戴维斯分校统计经济本科
个人经历
2019年5月- 2019年8月 加利福尼亚州圣克拉拉市帕洛阿尔托网络公司机器学习工程师实习生
基于深度学习(NLP)的网络安全应用恶意web请求检测系统的设计与部署;
使用Docker在GCP上开发虚拟环境,包括GPU环境、python环境和数据库连接;
使用Python构建数据管道,Elasticsearch处理数据(20M +),包括提取、清理、预处理(解码);
进行特征工程,包括标记化、字嵌入和字符嵌入的准备、序列截断等;
基于单词和字符嵌入、注意机制、CNN和双向LSTM建立了深度学习模型;
实时进行系统测试,准确率99.993%,召回率91%,并提交给利益相关者。
2018年7月- 2018年9月 伊利诺伊州芝加哥的Peltast Partners数据科学家实习生
构建数据管道,从美国钢铁网站抓取数据,使用Python和SQL进行数据清理和数据组织;
开发分析框架进行数据挖掘和建模,包括从网站抓取数据,用Beautiful soup和Python清理和操作数据,用AIC和0.9低的调整R平方构建回归模型;
构建UI仪表盘,可视化数据,为客户提供数据洞察,包括图表;用先进的Excel和PPT将分析结果打包成面向客户的可交付成果,并积极参与向客户展示。