获取结果-轮询模式
更新时间:2025-08-07
音频文件异步审核-获取结果-轮询模式
接口地址: https://aip.baidubce.com/rest/2.0/solution/v1/async_voice/pull
请求方式:POST
Body请求参数
参数名称 | 数据类型 | 是否必须 | 描述 |
---|---|---|---|
taskId | String | N | 提交任务接口返回的任务的唯一标识(与audioId二选一),有效期为30天 |
audioId | String | N | 用户侧音频唯一标识(与taskId二选一),当taskId与audioId同时传入时,优先查询taskId |
响应参数
参数名称 | 数据类型 | 描述 |
---|---|---|
log_id | Long | 请求唯一id,用于问题排查 |
error_code | Integer | 审核服务异常错误码 |
error_msg | String | 审核服务异常错误提示信息 |
conclusion | String | 音频任务审核结果描述:合规、不合规、疑似、审核失败 |
conclusionType | Integer | 音频任务审核结果值:1 合规,2 不合规,3 疑似,4 审核失败 |
audioId | String | 用户侧音频唯一标识 |
account | String | 用户侧音频备注 |
rawText | StringArray | 语音识别文本结果,字符串数组 |
taskId | String | 透传提交任务接口返回参数中的taskId |
data | JSONArray | 语音识别文本审核结果,参见data结构 |
taskInfo | JSONObject | 语音识别文本审核结果,参见data结构 |
phoneRisk | Map | 是否命中手机号风险检测 |
data结构
参数名称 | 数据类型 | 描述 |
---|---|---|
text | String | 分段文本结果 |
startTime | Long | 文本对应音频文件的起始时间戳 |
endTime | Long | 文本对应音频文件的终止时间戳 |
conclusion | String | 文本审核结果,可取值:合规、不合规、疑似、审核失败 |
conclusionType | Integer | 文本审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败 |
auditData | JSONArray | 文本审核结果详情,参见auditData结构 |
auditData结构
参数名称 | 数据类型 | 描述 |
---|---|---|
type | Integer | 审核主类型,11:百度官方违禁词库、12:文本反作弊、13:自定义文本黑名单、14:自定义文本白名单、20:存在娇喘内容、30:政治敏感、31暴恐违禁、33:色情、34:低俗辱骂、36:广告、37:广告法、38:隐私信息、39:低质灌水 因产品能力升级,自2025年7月26日起,新增以上30~39参数编号,客户可通过该编号对更细粒度审核结果进行解析获取。为了更好的服务体验,我们建议在2025年7月26日前已完成接入的老客户,能够尽快调整参数,而新客户可直接忽略编号12。如需技术指导,可提交工单,会有专人跟进处理。 |
subType | Integer | 审核子类型,此字段需参照type主类型字段决定其含义: 当type=11时subType取值含义:0:百度官方默认违禁词库 当type=12时subType取值含义:0:低质灌水、1:暴恐违禁、2:文本色情、3:政治敏感、4恶意推广、5:低俗辱骂、7:隐私信息 、8:广告法审核 当type=13时subType取值含义:0:自定义文本黑名单 当type=14时subType取值含义:0:自定义文本白名单 因产品能力升级,自2025年7月26日起,新增以下30~39审核子类型的参数编号,客户可通过以下编号对更细粒度审核结果进行解析获取。为了更好的服务体验,我们建议在2025年7月26日前已完成接入的老客户,能够尽快调整参数,而新客户可直接忽略编号12。如需技术指导,可提交工单,会有专人跟进处理。 当type=30时subType取值含义:300000:政治敏感 当type=31时subType取值含义:310000:暴恐违禁 当type=33时subType取值含义:330000:色情 当type=34时subType取值含义:340000:低俗辱骂 当type=36时subType取值含义: 360101:微信号、360102:QQ号、360103:电话号码、360104:网址、360105:座机、360106:电子邮箱、360200:社交广告、360300:游戏广告、360400:流量造假广告、360500:电商广告、360600:影视音乐资源广告、360700:金融广告、360800:医疗广告、360900:房产广告、361000:旅游广告、361100:招聘广告、361200:教培广告 当type=37时subType取值含义:370100:虚假诱导营销广告、370200:虚假权威营销广告、370300:禁止投放广告、370400:非法营销广告 当type=38时subType取值含义:380000:隐私信息 当type=39时subType取值含义:390000:低质灌水 |
msg | String | 不合规项描述信息 |
hits | JSONArray | 命中信息,参见hits结构 |
hits结构
参数名称 | 数据类型 | 描述 |
---|---|---|
probability | Float | 不合规项置信度 |
datasetName | String | 违规项目所属数据集名称 |
words | StringArray | 命中关键词 |
wordHitPositions | JSONArray | 命中关键词 |
modelHitPositions | Array | 送检文本命中模型的详细信息,包含位置信息及置信度信息。位置信息:命中模型的违规内容在送检原文中的位置(从0开始计算):“开始位置”、“结束位置”;置信度信息:命中模型对应的置信度分数(范围:0至1,数字越大,可能性越高)。返回示例见下方“成功响应示例——不合规”部分 |
wordHitPositions 结构
参数名称 | 数据类型 | 描述 |
---|---|---|
keyword | String | 送检文本命中词库的关键词 |
positions | Array | 关键词在送检原文中的位置(从0开始计算):分别为“起始位置”,“结束位置” |
label | String | 关键词命中的细分标签,标签规则见文末“细分标签对照表” |
taskInfo结构
参数名称 | 数据类型 | 描述 |
---|---|---|
taskDuration | Long | 任务时长,单位“秒” |
phoneRisk结构如下:
参数名称 | 数据类型 | 备注 |
---|---|---|
phoneRisk | Array | 手机号风险标签 |
+ firstLabelZH | String | 风险标签(中文),使用短横杠间隔 |
+ firstLabelEN | String | 风险标签(英文),使用短横杠间隔 |
+ level | Integer | 风险等级,0: 高风险 1: 中风 2: 低风险 3: 正常 4: 检测失败 |
userRisk | Array | 画像风险标签 |
+ firstLabelZH | String | 风险标签(中文),使用短横杠间隔 |
+ firstLabelEN | String | 风险标签(英文),使用短横杠间隔 |
+ level | Integer | 风险等级,0: 高风险 1: 中风 2: 低风险 3: 正常 4: 检测失败 |
phoneHash | Float | sha256加密的手机号 |
deviceId | Float | 设备 ID |
响应示例
Plain Text
1{
2 "log_id": 16415253958306825,
3 "error_code": 282008,
4 "error_msg": "task not complete"
5}
Plain Text
1{
2 "log_id": 16415253958306825,
3 "conclusion": "不合规",
4 "conclusionType": 2,
5 "audioId": "test_audioId_85643",
6 "account": "test_account_room_001",
7 "rawText": [
8 "加个微信慢慢聊,关注公众号百万资源等你来,我们产品是第一品牌,你吃一瓶安眠药就可以睡"
9 ],
10 "taskId": "e8ae004e-a8de-46fe-91b1-581a36310b40",
11 "taskDuration": 10,
12 "data": [
13 {
14 "conclusion": "不合规",
15 "conclusionType": 2,
16 "endTime": 9740,
17 "startTime": 0,
18 "text": "加个微信慢慢聊,关注公众号百万资源等你来,我们产品是第一品牌,你吃一瓶安眠药就可以睡",
19 "auditData": [
20 {
21 "hits": [
22 {
23 "wordHitPositions": [
24 {
25 "positions": [
26 [
27 32,
28 34
29 ]
30 ],
31 "label": "100200",
32 "keyword": "安眠药"
33 }
34 ],
35 "probability": 1.0,
36 "datasetName": "百度默认文本反作弊库",
37 "words": [
38 "安眠药"
39 ],
40 "modelHitPositions": [
41 [
42 0,
43 39,
44 0.7971
45 ]
46 ]
47 }
48 ],
49 "msg": "存在暴恐违禁不合规",
50 "subType": 1,
51 "type": 12
52 },
53 {
54 "hits": [
55 {
56 "wordHitPositions": [
57 {
58 "positions": [
59 [
60 9,
61 11
62 ],
63 [
64 2,
65 3
66 ]
67 ],
68 "label": "400200",
69 "keyword": "公众号&微信"
70 },
71 {
72 "positions": [
73 [
74 9,
75 11
76 ],
77 [
78 7,
79 8
80 ]
81 ],
82 "label": "400200",
83 "keyword": "公众号&关注"
84 },
85 {
86 "positions": [
87 [
88 7,
89 8
90 ],
91 [
92 2,
93 3
94 ]
95 ],
96 "label": "400200",
97 "keyword": "关注&微信"
98 }
99 ],
100 "probability": 1.0,
101 "datasetName": "百度默认文本反作弊库",
102 "words": [
103 "公众号 微信",
104 "公众号 关注",
105 "关注 微信"
106 ],
107 "modelHitPositions": [
108 [
109 0,
110 39,
111 0.9734
112 ]
113 ]
114 }
115 ],
116 "msg": "存在恶意推广不合规",
117 "subType": 4,
118 "type": 12
119 }
120 ]
121 }
122 ],
123 "taskInfo": {
124 "taskDuration": 10
125 }
126}