美国留学>背景提升>名校科研>科研实训-基于机器学习的文本挖掘

科研实训-基于机器学习的文本挖掘

项目地点:

北京 中关村

适合人群:

具有一定编程基础matlab/Python的学生

项目时间:

7月23日-8月24日

关联专业

计算机,软件
录取标准:简历审核+电话面试(注:学生需具有一定编程基础matlab/Python)。

实验方向

机器学习,数据挖掘,文本挖掘

实习成果

实验报告+推荐信

导师简介

中科院院博士,助理研究员。参与国家自然科学基金、国家重点研发计划项目等7项,在国际著名期刊杂志发表论文15篇(第一作者10篇)。

活动安排

7.23-8.42周远程辅导:项目背景了解,文献阅读,编程训练

8.5-8.9(5天实地实习:每天9:00-16:30)Day1: 文本聚类技术

常用文本聚类技术

k-means算法介绍

Project 1:对文档进行向量化表示

Day2: 主题建模技术

PLSA算法介绍

LDA算法介绍

Project 2:实现k-means算法

Day3: 内容安全技术

内容安全介绍

典型应用案例介绍

常用技术

Project 3:实现PLSA算法

Day4: 文本聚类在内容安全领域的应用

隐秘通信

主题模型在内容安全领域的应用

Project 4:利用LDA算法找到文本主题

Day5: 基于文本聚类的邮件数据分析

分析邮件数据

展示分析结果

项目开放问题讨论与下阶段任务布置

8.10-8.242周远程辅导:完成实验剩余部分

1. 继续在某数据集基础上,用pagerank算法找比较重要的几个人,从主题词中分析人物特点,职务等信息

2. 利用公开的中文语料库,比如搜狗语料库,做文本分类,计算下分类精度,对比不同算法的精度,效率

注:远程辅导是指导师利用邮件、QQ等进行任务布置、讲解和答疑。每周导师与学生沟通1-2次,每次1-2小时。具体时间可灵活安排。

更多推荐

免费
通话

留学问题轻松问

4000-970-969

手机请直接输入:如1860086xxxx

输入您的电话号码,点击通话,稍后您将接到我们的电话,该通话对您完全免费,请放心接听!

留学问题轻松问

4000-970-969

手机请直接输入:如1860086xxxx

输入您的电话号码,点击通话,稍后您将接到我们的电话,该通话对您完全免费,请放心接听!

只需 3
快速计算美国留学费用

留学费用?

  • 学费 ?美元/年
  • 生活费 ?美元/年
  • 住宿费 ?美元/年
  • 杂费 ?美元/年
  • 合计 ?美元/年

关注小满留学公众号,实时
分享留学攻略!

点击选择您所在年级:

* 点击选择您所希望的消费情况:

点击选择经济条件情况
勒紧裤腰带
勤俭是一种美德
花钱咱有诀窍
悠哉的小康路上
有钱咱就可劲儿花

以上数据仅作参考,个人根据所选学校不同、所在地区不同、个人消费习惯不同,会有所出入,详情需询问您的专属顾问老师。

只需 3
快速计算美国留学费用

留学机构不会告诉你

这样做可以更省钱!

获取更加省钱方案

关注小满留学公众号,实时
分享留学攻略!

计算结果
  • 学费 $17000 / 年
  • 生活费 $17000 / 年
  • 住宿费 $17000 / 年
  • 杂费 $17000 / 年
  • 共计 $17000 / 年

以上数据仅作参考,个人根据所选学校不同、所在地区不同、个人消费习惯不同,会有所出入,详情需询问您的专属顾问老师。