python获取NLPIR网站数据
admin
2023-07-04 07:23:58
0

有个自然语言处理的人工智能网站特别有意思,还能快速生成可视化图表,推荐给大家:http://ictclas.nlpir.org/nlpir/
如何爬取这个网站隐藏在背后的数据呢?
我这里演示一下联想词数据的爬取:

import requests,json

content=str(input('请输入要查询的文本:'))
url='http://ictclas.nlpir.org/nlpir/index6/getWord2Vec.do'
headers={
    'Referer': 'http://ictclas.nlpir.org/nlpir/',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'
}
data={
    'content': content
}
res=requests.post(url,headers=headers,data=data)

res_dic=json.loads(res.text)
w2vlist=res_dic['w2vlist']
for i in range(10):
    word=w2vlist[i]
    print(word)

这个网站的可视化功能也很强大,一键生成美丽图表~
这是快速生成词云图,用python的话比较麻烦一些,好处是可以进行个性化修改。如果没有太高要求的话,nlpir网站完全可以胜任:
python获取NLPIR网站数据
还有很多可视化图表,小伙伴们可以去尝试一下:
python获取NLPIR网站数据

相关内容

热门资讯

玄戒技术取得分频电路专利,实现... 国家知识产权局信息显示,北京玄戒技术有限公司取得一项名为“分频电路、分频器、射频芯片和电子设备”的专...
为什么今年香会基调明显变了 5月29日—31日在新加坡举行的第23届香格里拉对话会(简称“香会”),见证着元首引领下大国关系继续...
成本几毛钱、假驱蚊液香精兑水,... 入夏升温,蚊虫进入活跃期,驱蚊防护成为民生刚需,《财经调查》持续接到消费者投诉,他们买到的多款网红驱...
越来越多80后90后,正在丧失... 六一儿童节到来之际,朋友圈里开始出现一种熟悉的热闹。有人晒出零食礼包,有人半开玩笑地向伴侣讨礼物,还...
洋保电子取得用于低温环境的电气... 国家知识产权局信息显示,洋保电子(太仓)有限公司取得一项名为“一种用于低温环境的电气柜”的专利,授权...
中日韩飞手争霸宁波!2026无... 潮新闻客户端 记者 陈冲 通讯员 朱凝 5月31日,2026小遛·无人机竞速世界杯(中国·宁波鄞州站...
谁在对台湾“温水煮青蛙”? 近一段时间以来,两岸的舆论场都非常热闹,但话题却不尽相同。先看看岛内,马英九基金会的“家变”愈演愈烈...
上海磁骋取得超级电容主动均衡电... 国家知识产权局信息显示,上海磁骋交通科技有限公司取得一项名为“一种超级电容主动均衡电路”的专利,授权...
超市运送猪肉时,一只狗跑来啃食... 5月31日,湖北孝昌的网友发布视频称,一家超市在运送猪肉时,肉从车上搬下来后,一只黑色的狗跑来啃食猪...
日本要搞两个首都? 日本媒体日前报道,日本维新会正在推进将大阪设为“副首都”的构想,定于6月中旬组建一个专门小组。对此,...