我记得毕业前邮箱收到过中科院的仿arxiv网站的邮件,现在搜不到了。有人能告知一下么?
我想把里面的中文论文爬虫下来,做NLP的文本分类。
因为我做了个网站(http://www.colern.com),想加一个文章自动分类的功能,英文的arxiv语料库可以爬出来,中文的论文资源比较难找。现在网站已经支持latex文章发布,当然最主要的特点是你可以对发布的文章进行批注及评论~
我想把里面的中文论文爬虫下来,做NLP的文本分类。
因为我做了个网站(http://www.colern.com),想加一个文章自动分类的功能,英文的arxiv语料库可以爬出来,中文的论文资源比较难找。现在网站已经支持latex文章发布,当然最主要的特点是你可以对发布的文章进行批注及评论~











