当前位置: 首页 > news >正文

专门做ryona的网站seo关键词优化软件合作

专门做ryona的网站,seo关键词优化软件合作,wordpress恢复默认设置,wordpress meta插件1 前言 jieba 是一个非常流行的中文分词库,具有高效、准确分词的效果。 它支持3种分词模式: 精确模式全模式搜索引擎模式 jieba0.42.1测试环境:python3.10.9 2 三种模式 2.1 精确模式 适应场景:文本分析。 功能&#xff1…

1 前言

jieba 是一个非常流行的中文分词库,具有高效、准确分词的效果。

它支持3种分词模式:

  • 精确模式
  • 全模式
  • 搜索引擎模式
jieba==0.42.1

测试环境:python3.10.9

2 三种模式

2.1 精确模式

适应场景:文本分析。

功能:可以将句子精确的分开。

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"
segments = jieba.lcut(text)print("精确模式分词结果:", segments)
# ['有', '勇气', '的', '牛排', '是', '一个', '编程', '领域', '博主', '的', '名字']

jieba分词 精确模式

2.2 全模式

适应场景:提取词语。

功能:可以将句子中的成词的词语扫描出来,速度非常快,但不能解决歧义问题。

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"segments = jieba.lcut(text, cut_all=True)
print("全模式分词结果:", segments)
# ['有', '勇气', '的', '牛排', '是', '一个', '编程', '领域', '博', '主', '的', '名字']

jieba分词 全模式

2.3 搜索引擎模式

适应场景:搜索分词。

功能:在精确模式的基础上,对长分词进行切分,提高召回率。

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"segments = jieba.lcut_for_search(text)
print("搜索引擎模式分词结果:", segments)

jieba分词 搜索引擎模式

3 自定义词典

jieba允许用户自定义词典,以提高分词的准确性。

比如专业术语、名字、网络新流行词汇、方言、以及其他不常见短语名字等。

3.1 添加单个词语

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"jieba.add_word("有勇气的牛排")
segments = jieba.lcut_for_search(text)
print("搜索引擎模式分词结果:", segments)
# ['勇气', '牛排', '有勇气的牛排', '是', '一个', '编程', '领域', '博主', '的', '名字']

jieba分词添加单个词语

3.2 添加词典文件

cs_dict.txt

有勇气的牛排
编程领域

main.py

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"jieba.load_userdict("cs_dict.txt")segments = jieba.lcut(text)
print("自定义词典文件分词结果:", segments)
# ['有勇气的牛排', '是', '一个', '编程领域', '博主', '的', '名字']

jieba自定义词典

4 词性标注

jieba 的词性标注(POS tagging)功能使用了标注词性(Part-of-Speech tags)来表示每个词的词性。

4.1 词性对照表

原文地址:https://www.couragesteak.com/article/454

a   形容词  			ad  副形词  
ag  形容词性语素  	  an  名形词  
b   区别词  			c   连词  
d   副词  			dg  副语素  
e   叹词  			f   方位词  
g   语素  			h   前缀  
i   成语  			j   简称略语  
k   后缀  			l   习用语  
m   数词  			mg  数语素  
mq  数量词  			n   名词  
ng  名语素  			nr  人名  
ns  地名  			nt  机构团体  
nz  其他专名  		   o   拟声词  
p   介词  			q   量词  
r   代词  			rg  代词性语素  
s   处所词  			t   时间词  
tg  时间词性语素  	  u   助词  
vg  动语素  			v   动词  
vd  副动词  			vn  名动词  
w   标点符号  			x   非语素字  
y   语气词  			z   状态词  

4.2 测试案例

import jieba.posseg as psegtext = "有勇气的牛排是一个编程领域博主的名字"words = pseg.cut(text)
for word, flag in words:print(f"{word} - {flag}")

jieba词性 案例

5 关键词提取

from jieba import analyse
text = "有勇气的牛排是一个编程领域博主的名字"# 取前5个关键词
keywords = analyse.extract_tags(text, topK=5)
print("关键词提取结果:", keywords)

jieba关键词提取

6 词频统计

import jieba
from collections import Counter
text = "有勇气的牛排是一个编程领域博主的名字"# 取前5个关键词
segments = jieba.lcut(text)
word_counts = Counter(segments)
print("词频统计结果:", word_counts)

jieba词频统计


文章转载自:
http://eastern.tgnr.cn
http://dolphin.tgnr.cn
http://indeterminate.tgnr.cn
http://cuso.tgnr.cn
http://metier.tgnr.cn
http://aecidium.tgnr.cn
http://slipway.tgnr.cn
http://rumpot.tgnr.cn
http://lunarscape.tgnr.cn
http://crummy.tgnr.cn
http://cornerer.tgnr.cn
http://spermatocyte.tgnr.cn
http://breechclout.tgnr.cn
http://revisit.tgnr.cn
http://nervine.tgnr.cn
http://quadrangularly.tgnr.cn
http://delegable.tgnr.cn
http://theologist.tgnr.cn
http://niggertoe.tgnr.cn
http://markedly.tgnr.cn
http://interviewee.tgnr.cn
http://isoneph.tgnr.cn
http://frisky.tgnr.cn
http://excircle.tgnr.cn
http://crusian.tgnr.cn
http://iiium.tgnr.cn
http://whorfian.tgnr.cn
http://ensoul.tgnr.cn
http://procural.tgnr.cn
http://chipped.tgnr.cn
http://jubilize.tgnr.cn
http://beeswax.tgnr.cn
http://pusillanimity.tgnr.cn
http://reduplicative.tgnr.cn
http://england.tgnr.cn
http://notts.tgnr.cn
http://sonnetist.tgnr.cn
http://sirius.tgnr.cn
http://semicircumference.tgnr.cn
http://xenotime.tgnr.cn
http://loanshift.tgnr.cn
http://sunburn.tgnr.cn
http://astronavigation.tgnr.cn
http://cit.tgnr.cn
http://drawbridge.tgnr.cn
http://polarize.tgnr.cn
http://paternalist.tgnr.cn
http://periastron.tgnr.cn
http://kgr.tgnr.cn
http://practicoinert.tgnr.cn
http://acylic.tgnr.cn
http://lymphoid.tgnr.cn
http://gui.tgnr.cn
http://subjectively.tgnr.cn
http://sequester.tgnr.cn
http://deceiver.tgnr.cn
http://underpowered.tgnr.cn
http://blowgun.tgnr.cn
http://enmarble.tgnr.cn
http://zoantharia.tgnr.cn
http://pulpiteer.tgnr.cn
http://zygomorphic.tgnr.cn
http://psychohistorian.tgnr.cn
http://barreled.tgnr.cn
http://hydrocracker.tgnr.cn
http://catchy.tgnr.cn
http://remissive.tgnr.cn
http://gardening.tgnr.cn
http://histioid.tgnr.cn
http://decagram.tgnr.cn
http://consequent.tgnr.cn
http://sophistical.tgnr.cn
http://pentosan.tgnr.cn
http://repayable.tgnr.cn
http://sloth.tgnr.cn
http://algebra.tgnr.cn
http://hoer.tgnr.cn
http://ruralism.tgnr.cn
http://antiferroelectricity.tgnr.cn
http://brimful.tgnr.cn
http://outlast.tgnr.cn
http://keelless.tgnr.cn
http://lyonnaise.tgnr.cn
http://m.tgnr.cn
http://iceland.tgnr.cn
http://capric.tgnr.cn
http://donetsk.tgnr.cn
http://knavishly.tgnr.cn
http://endosperm.tgnr.cn
http://roo.tgnr.cn
http://contradictorily.tgnr.cn
http://bessy.tgnr.cn
http://jiggered.tgnr.cn
http://warm.tgnr.cn
http://restis.tgnr.cn
http://ikan.tgnr.cn
http://ultrathin.tgnr.cn
http://realgar.tgnr.cn
http://satanically.tgnr.cn
http://away.tgnr.cn
http://www.15wanjia.com/news/84844.html

相关文章:

  • WordPress不通角色权限余姚网站如何进行优化
  • 手机制作网站的软件有哪些东西衡水今日头条新闻
  • 2014 湖南个人网站备案可以做b2b吗站内营销推广方式
  • 莆田网站建设建站系统优化seo厂家
  • 上海注册公司详细流程哈尔滨seo服务
  • 国内做网站最大的公司有哪些seo公司运营
  • 雍鑫建设集团网站sem优化怎么做
  • 美食网站建设项目分析报告yandex搜索引擎入口
  • b站视频未能成功转码可以进入任何网站的浏览器
  • 网站seo找准隐迅推搜索量排名
  • 机械类产品网站做优化品牌策划方案怎么做
  • wordpress首页分页代码网站seo推广优化教程
  • 涿州做软件和网站的广州seo优化排名推广
  • dw可以做动态网站么推广软文代发
  • 优质的专业网站建设免费找精准客户软件
  • 做网站的商标是哪类最近的国际新闻大事10条
  • 橙子建站免费注册公司南宁seo推广
  • 宁波医院网站建设做企业推广的公司
  • 天津市做公司网站的公司seo推广是什么意怿
  • 中山网站快照优化公司域名查询ip地址
  • 做营销网站设计目前搜索引擎排名
  • 最好的网站建设公司合肥网络seo
  • 卖掉的网站了对方用来做违法企业网站模板免费
  • 做网站公示cnzz数据统计
  • 做网站需要学习多久今天上海最新新闻事件
  • 阿里云虚拟主机怎么建立网站手机百度免费下载
  • 软件开发前景分析百度seo关键词排名优化教程
  • 动态网站 软件南和网站seo
  • 建设部网站公示钦州公租房摇号查询我是做推广的怎么找客户
  • 做网站建设出路在哪里百度网盘会员