# 文本分词对文本进行分词处理。 ## 请求格式说明 ** 调试工具：** 在线调试

请求方式：POST (HTTPS)

请求地址：

https://open.welink.huaweicloud.com/api/aiservice/v1/nlp/segment

认证方式： access_token，请参考获取access_token

请求头部：

Content-Type: application/json
x-wlk-Authorization: access_token

请求参数：

{
    "text":"今天天气真好",
    "posSwitch":1,
    "lang":"zh",
    "criterion":"PKU"
}

请求参数说明：

参数	必选	参数类型	说明
text	是	String	待分词文本，长度为1~512，文本编码为UTF-8。
posSwitch	否	Integer	是否开启词性标注功能，1为开启，0为关闭，默认为关闭。
lang	否	String	支持的文本语言类型，目前只支持中文，默认为zh。
criterion	否	String	支持的分词规范，目前支持PKU（北大分词标准）、CTB（宾州树库标准），默认为PKU。

请求示例：

 curl -X POST \
  'https://open.welink.huaweicloud.com/api/aiservice/v1/nlp/segment' \
  -H 'Accept-Charset: UTF-8' \
  -H 'Content-Type: application/json' \
  -H 'x-wlk-Authorization: access_token' \
  -d '{"text":"今天天气真好","posSwitch":1,"lang":"zh","criterion":"PKU"}'

响应格式说明

返回结果

正常返回结果

{
    "code": "0",
    "data": {
        "words": [
            {
                "content": "今天",
                "pos": "t"
            },
            {
                "content": "天气",
                "pos": "n"
            },
            {
                "content": "真",
                "pos": "d"
            },
            {
                "content": "好",
                "pos": "a"
            }
        ]
    },
    "error": "",
    "message": "ok"
}

异常返回结果

分词失败响应示例

{
    "code": "58002",
    "data": null,
    "error": "argument valid error:text.must not be blank;text.text for segment should between 1 and 512;",
    "message": "NLP service call exception"
}

Token验证失败响应示例

{
    "code": "58401",
    "data": null,
    "error": "Failed to verify the token.",
    "message": "Login authentication failed."
}

返回参数说明

参数	必选	参数类型	说明
code	是	String	错误码
message	是	String	调用成功时为"ok"。调用失败时的错误信息。
data	是	Object	调用成功时表示调用结果，详见data数据结构。调用失败时为null。
error	是	String	错误信息。

data 数据结构

参数	必选	参数类型	说明
words	是	Array [word]	分词结果，请参见word数据结构。

word 数据结构

参数	必选	参数类型	说明
content	是	String	词汇文本。
pos	否	String	词汇对应的词性。详细说明请参见：（PKU）pos词性说明（CTB）pos词性说明

（PKU）pos词性说明

一类词性	二类词性	三类词性
n：名词	nr：人名	nr1：汉语姓氏 nr2：汉语名字 nrj：日语人名 nrf：音译人名
	ns：地名	nsf：音译地名
	nt：机构团体名	-
	nz：其它专名	-
	nl：名词性惯用语	-
	ng：名词性语素	-
t：时间词	tg：时间词性语素	-
s：处所词	-	-
f：方位词	-	-
v：动词	vd：副动词	-
	vn：名动词	-
	vshi：动词“是”	-
	vyou：动词“有”	-
	vf：趋向动词	-
	vx：形式动词	-
	vi：不及物动词（内动词）	-
	vl：动词性惯用语	-
	vg：动词性语素	-
a：形容词	ad：副形词	-
	an：名形词	-
	ag：形容词性语素	-
	al：形容词性惯用语	-
b：区别词	bl：区别词性惯用语	-
z：状态词	-	-
r：代词	rr：人称代词	-
	rz：指示代词	rzt：时间指示代词 rzs：处所指示代词 rzv：谓词性指示代词
	ry：疑问代词	ryt：时间疑问代词 rys：处所疑问代词 ryv：谓词性疑问代词
	rg：代词性语素	-
m：数词	mq：数量词	-
	mg：甲、乙、丙、丁、戊、己、庚、辛、壬、癸	-
q：量词	qv：动量词	-
	qt：时量词	-
d：副词	-	-
p：介词	pba：介词“把”	-
	pbei：介词“被”	-
c：连词	cc：并列连词	-
u：助词	uzhe：着	-
	ule：了、喽	-
	uguo：过	-
	ude1：的、底	-
	ude2：地	-
	ude3：得	-
	usuo：所	-
	udeng：等、等等云云	-
	uyy：一样、一般似的、般	-
	udh：的话	-
	uls：来讲、来说而言、说来	-
	uzhi：之	-
	ulian：连（“连小学生都会”）	-
e：叹词	-	-
y：语气词(delete yg)	-	-
o：拟声词	-	-
h：前	-	-
k：后	-	-
x：字符串	xe：Email字符串	-
	xs：微博会话分隔符	-
	xm：表情符号	-
	xu：网址URL	-
w：标点符号	wkz：左括号，全角：（〔［｛《【〖〈半角：( [ { <	-
	wky：右括号，全角：）〕］｝》】〗〉半角： ) ] { >	-
	wyz：左引号，全角： “ ‘ 『	-
	wyy：右引号，全角：” ’ 』	-
	wj：句号，全角：。	-
	ww：问号，全角：？半角：?	-
	wt：叹号，全角：！半角：!	-
	wd：逗号，全角：，半角：,	-
	wf：分号，全角：；半角： ;	-
	wn：顿号，全角：、	-
	wm：冒号，全角：：半角： :	-
	ws：省略号，全角：…… …	-
	wp：破折号，全角：—— －－ ——－半角：--- ----	-
	wb：百分号千分号，全角：％ ‰ 半角：%	-
	wh：单位符号，全角：￥＄ > ° ℃ 半角：$	-

（CTB）pos词性说明

词性	名称	示例
AD	副词	不也就
AS	动态助词	了著过
BA	把字结构	将把
CC	并列连接词	和与
CD	限定数量词	一两三
CS	从属连接词	虽然如果若
DEC	补语或名词化	的之
DEG	关联或所有格	的之
DER	补语短语"得"	得
DEV	方式"地"	地
DT	限定词	这各全
ETC	等等	等等等
FW	外来词	A E B
IJ	感叹词	唉呀哈拉
JJ	名词修饰词	大新小
LB	长"被"结构	被为受
LC	方位词	中上时
M	量词	个年美元
MSP	其他助词	所而来
NN	名词	经济企业人
NR	专有名词	中国浙江
NT	时间名词	目前去年
OD	数词	第一第二首
ON	拟声词	O
P	介词	在对以
PN	代词	他我自己
PU	标点符号	，。
SB	短"被"结构	被遭
SP	句末助词	了的吗
VA	谓词性形容词	大多好
VC	系动词	是为非
VE	主要动词"有"	有没有无
VV	动词	说要会

错误码说明

错误码	说明
0	成功。
58401	无权限。
58402	非法参数异常。
58500	服务异常。
58002	NLP服务异常。

响应格式说明

结果。 ""

无结果。 ""