织梦CMS - 轻松建站从此开始!

葡京赌场-葡京娱乐-葡京网址-葡京娱乐平台-葡京开户注册

当前位置: 主页 > 搜狗问问 >

SparkMLlib实现的中文文本分类–Native Bayes - …

时间:2018-11-01 17:35来源:未知 作者:admin 点击:
文本分类是指将一篇文章归到事先定义好的某一类或者某几类,在数据平台的一个典型的应用场景是,通过爬取用户浏览过的页面内容,识别出用户的浏览偏好,从而丰富该用户的画像。每个分类下有几千个文档,这里将这些语料进行分词,然后每一个分类生成一个文件,在该文件中,每一行数据表示一个文档的分词结果,重新用0-9作为这10个分类的编号: (责任编辑:admin)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------