创始人简介
基本情况
余海峰,松鼠学苑创始人、天津精赛科技有限公司总经理,南开大学通信硕士学位,南开大学计算机学士学位,著有《深入理解Flink: 实时大数据处理实践》一书、公开技术课程《Spark快速大数据处理》。
创业历程
早年从南开大学硕士毕业后深受开源文化的影响和启发,2016年,余海峰先生以个人的名义联合就职于百度、阿里、华为、头条、新浪、58同城等一二线互联网企业以及大型金融机构的资深大数据人工智能资深工程师组建了学术组织松鼠学苑,其目标是推广前沿科技以加快我国的软件科技发展。
以此为契机,松鼠学苑开展了一系列有深度的技术研究工作,如承接基于电信数据的智能语义分析项目、研发HFS(Hadoop From Scratch)平台、开展高端培训与职业教育培训。
在组织大数据人工智能培训班的过程中,松鼠学苑会将近40%的精力投入到实训环境的维护上。当时松鼠学苑给每名学员租用三台云服务器,在学习某个模块(如Hadoop、Tensorflow)之前松鼠学苑会使用Linux脚本将这三台服务器初始化,后来松鼠学苑使用预先编译好的镜像进行初始化以提高效率,但是都会遇到诸多痛点。
经过全面调研,市场上并没有这类问题的成熟解决方案;这期间,微软公司在大力发展Visual Studio Code以替代自家成功占领市场的开发工具Visual Studio XX(如Visual Studio C++),而且有开源团队也在研发网页版的Visual Studio Code,这给解决这类痛点带来了曙光。
于是,2018年,松鼠学苑创始人投入到解决这类痛点的工作之中,经过多次迭代和培训试用检验,松鼠学苑创始人终于研发出了对应的软件平台架构,即She(Squirrel technology higher extensible platform)平台架构。这种松耦合的架构设计规避了培训课程平台与底层平台的相互依赖。
为了方便开展校企合作业务,2019年,余海峰先生在天津注册成立天津精赛科技有限公司。此后,松鼠学苑这个品牌由天津精赛科技有限公司运营。
近年科研情况
1、主持人民银行征信系统架构设计与研发实施,主持多子系统消费金融交易平台架构设计,主持信贷风险等级分类预测模型、消费信贷评分卡模型设计。
2、主持基于电信数据的智能语义分析系统研发,构建大数据平台、以分布式计算解决每天增量为PB级的数据分析任务,训练深度学习NLP模型用于语义理解与分类,并根据语义输出结构化标注构建文本的特征,并实时更新信息主体(信贷场景下的受信方)画像。
3、主持研发消费金融大数据决策平台。
4、发表著作《深入理解Flink: 实时大数据处理实践》。
5、发表论文《边缘计算与大数据处理技术的对比研究》。
6、主持架构大数据人工智能基础设施She平台,原创Docker容器化大数据人工智能教研集群用于大数据人工智能高等教育教学,该平台构建在docker虚拟化容器之上,为所有用户提供一致的、隔离的、基于Devfile预定义的、一键式创建/删除、运行在公有云/私有云的远端开发环境。。
7、主持研发容器化全栈大数据平台HFS,HFS提供每用户独立一套的、分步骤大数据实训环境,并提供分布式存储与算法调度后台容器。
8、原创非侵入式数据共享技术(未申请专利)。
9、主持研发大模型教研平台NFS(NLP From Scratch),设计AFS平台中CPU/GPU算力资源管理与算法运行调度模块,简化Transformer、Bert、XLNet、GPT-3架构,以降低NLP双向语言模型训练的算力消耗,以达到低成本、短时间完成NLP原理教学实训目标。
10、完成《人工智能教研平台AFS架构设计方案》、《NLP教研平台NFS中双向语言模型算力研究报告》。
11、研发教案《NLP技术精要》,以剖析BERT、GPT-3、XLNet实现代码为核心内容,讲述NLP的核心思想、特别是注意力机制的核心思想,为NLP技术的推广做出了巨大贡献。
12、申请软著:《精赛科技She软件科学教研大数据平台软件》、《精赛科技She大数据可视化分析教研平台》、《精赛科技She综合实训管理平台》、《精赛科技She虚拟化技术专家系统》、《精赛科技She智慧云课堂与在线考试评测系统》。