当前在线人数11322
首页 - 分类讨论区 - 电脑网络 - 数据科学版 - 同主题阅读文章

此篇文章共收到打赏
0

  • 10
  • 20
  • 50
  • 100
您目前伪币余额:0
未名交友
[更多]
[更多]
有没有做sentiment analysis的,求思路 (转载)
[版面:数据科学][首篇作者:waynezh] , 2017年10月26日11:07:42 ,802次阅读,5次回复
来APP回复,赚取更多伪币 关注本站公众号:
[分页:1 ]
waynezh
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: waynezh (van), 信区: DataSciences
标  题: 有没有做sentiment analysis的,求思路 (转载)
发信站: BBS 未名空间站 (Thu Oct 26 11:07:42 2017, 美东)

【 以下文字转载自 Programming 讨论区 】
发信人: waynezh (van), 信区: Programming
标  题: 有没有做sentiment analysis的,求思路
发信站: BBS 未名空间站 (Thu Oct 26 11:06:28 2017, 美东)

在公司做sentiment analysis,

现在的做法是这样

首先在大概几万句sentences中训练出word2vec model
然后将大概4000个labels的sentences转成vector, 80%作为training, 20%作为testing
, 用neural net作为classifier

类别三类,positive, neutral, negative

之前是公司的一个印度人在负责,达到63% accuracy
我接手之后调参 + 做一些ensemble提高到68%  leader似乎不满足,觉得可以到70%甚
至80%

现在我想到思路有几个
1. 做semi-supervise, 没有label的数据有的是
2. unsupervise learning, 比如用autoencoder来initialize neural net
3. GBM or Random forest? 觉得这几个不可能超过我现在这个了

来这里希望得到一些启发,谢啦!

--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 170.]

 
si3
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 2 ]

发信人: si3 (nico), 信区: DataSciences
标  题: Re: 有没有做sentiment analysis的,求思路 (转载)
发信站: BBS 未名空间站 (Wed Nov  1 15:38:38 2017, 美东)

Do you try dimension reduction before Neural net classifier?
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2604:6000:b40a:]

 
si3
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 3 ]

发信人: si3 (nico), 信区: DataSciences
标  题: Re: 有没有做sentiment analysis的,求思路 (转载)
发信站: BBS 未名空间站 (Wed Nov  1 15:40:47 2017, 美东)

Also is there a classfication imbalance problem? (4000 document for three
classes)
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2604:6000:b40a:]

 
si3
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 4 ]

发信人: si3 (nico), 信区: DataSciences
标  题: Re: 有没有做sentiment analysis的,求思路 (转载)
发信站: BBS 未名空间站 (Wed Nov  1 15:50:14 2017, 美东)

And another question? Why word2vec? If we classify a who document, word of
bag/tfidf is better.
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2604:6000:b40a:]

 
si3
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 5 ]

发信人: si3 (nico), 信区: DataSciences
标  题: Re: 有没有做sentiment analysis的,求思路 (转载)
发信站: BBS 未名空间站 (Wed Nov  1 16:23:29 2017, 美东)

in one of the projects I did, I just use textblob to do sentiment analysis,
it returns a score within [-1,1] for each document. this way, don't even
need word embedding at all..
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2604:6000:b40a:]

[分页:1 ]
[快速返回] [ 进入数据科学讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996