设为首页收藏本站

开启辅助访问切换到窄版

爱开源网»首页 › 数字人 › 人工智能 › 安装spacy+zh_core_web_sm避坑指南

安装spacy+zh_core_web_sm避坑指南

1659 |

0 | 2023-8-23 11:37:37 | 显示全部楼层 |阅读模式

目次

一、spacy简介
二、安装spacy
三、安装zh_core_web_sm
四、安装en_core_web_sm
五、效果测试
5.1 英文测试
5.2 中文测试

一、spacy简介

spacy是Python自然语言处理惩罚（NLP）软件包，可以对自然语言文本做词性分析、命名实体辨认、依赖关系描画，以及词嵌入向量的盘算和可视化等。
二、安装spacy

利用“pip install spacy"报错，或者安装完spacy，无法正常调用，可以通过以下链接将whl文件下载到本地，然后 cd 到文件路径下，通过 pip 安装。
下载链接：
Archived: Python Extension Packages for Windows - Christoph Gohlke (uci.edu)
选择对应的版本：

三、安装zh_core_web_sm

通过下方链接下载 whl 文件到本地：
zh_core_web_sm · Releases · explosion/spacy-models (github.com)
选择对应的版本：

下载好对应版本的zh_core_web_sm.whl文件，cd 文件生存目次，然后通过pip安装。
安装成功提示：

四、安装en_core_web_sm

通过下方链接下载 whl 文件到本地：
en_core_web_sm · Releases · explosion/spacy-models (github.com)
选择对应的版本：

下载好对应版本的zh_core_web_sm.whl文件，cd 文件生存目次，然后通过pip安装。

五、效果测试

5.1 英文测试

# 导入英文类
from spacy.lang.en import English
# 实例化一个nlp类对象，包含管道pipeline
nlp = English()
# print(nlp)
doc = nlp("December is excited!")
# 迭代tokens
for token in doc:
print(token.text)
token = doc[1]
print(token.text)

复制代码

输出结果：

December
is
excited
!
is

复制代码

5.2 中文测试

# 处理文本
nlp = spacy.load('zh_core_web_sm')
doc = nlp("微软准备用十亿美金买下这家英国的创业公司。")
# 遍历识别出的实体
for ent in doc.ents:
# 打印实体文本及其标注
print(ent.text, ent.label_)

复制代码

输出结果：

微软 ORG
十亿美金 MONEY
英国 NORP

复制代码

来源：https://blog.csdn.net/weixin_43734080/article/details/130093099
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

回复

使用道具举报

返回列表发新帖

只关于篮球

20 主题	0 回帖	60 积分

Rank: 2

积分: 60

回复楼主返回列表

图文推荐

绿色-剑灵怀旧完整主线（10月更新）有韩服: 2024-09-12

非绿色-黑鳍自动换角色组队吃药自动没疲劳刷金: 2024-09-21

非绿色-定制AI全自动黑鳍V1.2: 2024-09-14

剑灵三系精修端星术咒3鬼3 T2 饰品属性外观: 2023-08-16

Unity 超级马里奥: 2023-08-22

热门排行