当前在线人数5814
首页 - 分类讨论区 - 电脑网络 - 数据科学版 - 同主题阅读文章

此篇文章共收到打赏
0

  • 10
  • 20
  • 50
  • 100
您目前伪币余额:0
未名交友
[更多]
[更多]
TF-IDF能检查源程序抄袭吗? (转载)
[版面:数据科学][首篇作者:somehow] , 2019年02月23日18:05:24 ,525次阅读,1次回复
来APP回复,赚取更多伪币 关注本站公众号:
[分页:1 ]
somehow
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: somehow (修身健体), 信区: DataSciences
标  题: TF-IDF能检查源程序抄袭吗? (转载)
发信站: BBS 未名空间站 (Sat Feb 23 18:05:24 2019, 美东)

【 以下文字转载自 Programming 讨论区 】
发信人: somehow (修身健体), 信区: Programming
标  题: TF-IDF能检查源程序抄袭吗?
发信站: BBS 未名空间站 (Sat Feb 23 11:22:04 2019, 美东)

我的理解它把所有的单词列出来,然后看出现的频率。
对于论文我觉得可行,大部分是真正的单词。

但源代码的问题是变量名是自己定义的,每人的变量名很可能都不一样,会形成噪音吧?
函数名也是同样的问题,如果是自己写的函数,这名字也可以是各人的都不一样。
如果区分系统的还是自己的函数?

不是很懂,请大家讲讲,谢谢!

--
※ 修改:·somehow 於 Feb 23 18:04:31 2019 修改本文·[FROM: 96.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 96.]

 
nacst23
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 2 ]

发信人: nacst23 (cnc), 信区: DataSciences
标  题: Re: TF-IDF能检查源程序抄袭吗? (转载)
发信站: BBS 未名空间站 (Tue Mar  5 14:29:12 2019, 美东)

possible,
but you need to build hash table to two "same variable" with different names
(on purpose).

【 在 somehow (修身健体) 的大作中提到: 】
: 发信人: somehow (修身健体), 信区: Programming
: 标  题: TF-IDF能检查源程序抄袭吗?
: 发信站: BBS 未名空间站 (Sat Feb 23 11:22:04 2019, 美东)
: 我的理解它把所有的单词列出来,然后看出现的频率。
: 对于论文我觉得可行,大部分是真正的单词。
: 但源代码的问题是变量名是自己定义的,每人的变量名很可能都不一样,会形成噪音
吧?
: 函数名也是同样的问题,如果是自己写的函数,这名字也可以是各人的都不一样。
: 如果区分系统的还是自己的函数?
: 不是很懂,请大家讲讲,谢谢!



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 199.]

[分页:1 ]
[快速返回] [ 进入数据科学讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996