获取结果-回调模式
更新时间:2025-08-07
音频文件异步审核-获取结果-回调模式
回调模式为,服务端将异步提交的音频任务对应的审核结果自动推送至客户指定的地址。若需要该模式,需要在提交任务的请求参数中传入callbackUrl。 请求体格式化:content-type:application/json
回调参数
参数名称 | 数据类型 | 描述 | |
---|---|---|---|
log_id | Long | 请求唯一id,用于问题排查 | |
error_code | Integer | 审核服务异常错误码 | |
error_msg | String | 审核服务异常错误提示信息 | |
conclusion | String | 音频任务审核结果描述:合规、不合规、疑似、审核失败 | |
conclusionType | Integer | 音频任务审核结果值:1 合规,2 不合规,3 疑似,4 审核失败 | |
audioId | String | 用户侧音频唯一标识 | |
account | String | 用户侧音频备注 | |
rawText | StringArray | 语音识别文本结果,字符串数组 | |
taskId | String | 透传提交任务接口返回参数中的taskId,有效期为15天 | |
data | JSONArray | 语音识别文本审核结果,参见data结构 | |
taskInfo | JSONObject | 音频审核任务的时长,单位为秒 | |
phoneRisk | Map | 是否命中手机号风险检测 |
data结构
参数名称 | 数据类型 | 描述 |
---|---|---|
text | String | 分段文本结果 |
startTime | Long | 文本对应音频文件的起始时间戳 |
endTime | Long | 文本对应音频文件的终止时间戳 |
conclusion | String | 文本审核结果,可取值:合规、不合规、疑似、审核失败 |
conclusionType | Integer | 文本审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败 |
auditData | JSONArray | 文本审核结果详情,参见auditData结构 |
auditData结构
参数名称 | 数据类型 | 描述 |
---|---|---|
type | Integer | 审核主类型,11:百度官方违禁词库、12:文本反作弊、13:自定义文本黑名单、14:自定义文本白名单、20:存在娇喘内容、30:政治敏感、31暴恐违禁、33:色情、34:低俗辱骂、36:广告、37:广告法、38:隐私信息、39:低质灌水 因产品能力升级,自2025年7月26日起,新增以上30~39参数编号,客户可通过该编号对更细粒度审核结果进行解析获取。为了更好的服务体验,我们建议在2025年7月26日前已完成接入的老客户,能够尽快调整参数,而新客户可直接忽略编号12。如需技术指导,可提交工单,会有专人跟进处理。 |
subType | Integer | 审核子类型,此字段需参照type主类型字段决定其含义: 当type=11时subType取值含义:0:百度官方默认违禁词库 当type=12时subType取值含义:0:低质灌水、1:暴恐违禁、2:文本色情、3:政治敏感、4恶意推广、5:低俗辱骂、7:隐私信息 、8:广告法审核 当type=13时subType取值含义:0:自定义文本黑名单 当type=14时subType取值含义:0:自定义文本白名单 因产品能力升级,自2025年7月26日起,新增以下30~39审核子类型的参数编号,客户可通过以下编号对更细粒度审核结果进行解析获取。为了更好的服务体验,我们建议在2025年7月26日前已完成接入的老客户,能够尽快调整参数,而新客户可直接忽略编号12。如需技术指导,可提交工单,会有专人跟进处理。 当type=30时subType取值含义:300000:政治敏感 当type=31时subType取值含义:310000:暴恐违禁 当type=33时subType取值含义:330000:色情 当type=34时subType取值含义:340000:低俗辱骂 当type=36时subType取值含义: 360101:微信号、360102:QQ号、360103:电话号码、360104:网址、360105:座机、360106:电子邮箱、360200:社交广告、360300:游戏广告、360400:流量造假广告、360500:电商广告、360600:影视音乐资源广告、360700:金融广告、360800:医疗广告、360900:房产广告、361000:旅游广告、361100:招聘广告、361200:教培广告 当type=37时subType取值含义:370100:虚假诱导营销广告、370200:虚假权威营销广告、370300:禁止投放广告、370400:非法营销广告 当type=38时subType取值含义:380000:隐私信息 当type=39时subType取值含义:390000:低质灌水 |
msg | String | 不合规项描述信息 |
hits | JSONArray | 命中信息,参见hits结构 |
hits结构
参数名称 | 数据类型 | 描述 |
---|---|---|
probability | Float | 不合规项置信度 |
datasetName | String | 违规项目所属数据集名称 |
words | StringArray | 命中关键词 |
wordHitPositions | JSONArray | 命中关键词 |
modelHitPositions | Array | 送检文本命中模型的详细信息,包含位置信息及置信度信息。位置信息:命中模型的违规内容在送检原文中的位置(从0开始计算):“开始位置”、“结束位置”;置信度信息:命中模型对应的置信度分数(范围:0至1,数字越大,可能性越高)。返回示例见下方“成功响应示例——不合规”部分 |
wordHitPositions 结构
参数名称 | 数据类型 | 描述 |
---|---|---|
keyword | String | 送检文本命中词库的关键词 |
positions | Array | 关键词在送检原文中的位置(从0开始计算):分别为“起始位置”,“结束位置” |
label | String | 关键词命中的细分标签,标签规则见文末“细分标签对照表” |
taskInfo结构
参数名称 | 数据类型 | 描述 |
---|---|---|
taskDuration | Long | 任务时长,单位为“秒” |
phoneRisk结构如下:
参数名称 | 数据类型 | 备注 |
---|---|---|
phoneRisk | Array | 手机号风险标签 |
+ firstLabelZH | String | 风险标签(中文),使用短横杠间隔 |
+ firstLabelEN | String | 风险标签(英文),使用短横杠间隔 |
+ level | Integer | 风险等级,0: 高风险 1: 中风 2: 低风险 3: 正常 4: 检测失败 |
userRisk | Array | 画像风险标签 |
+ firstLabelZH | String | 风险标签(中文),使用短横杠间隔 |
+ firstLabelEN | String | 风险标签(英文),使用短横杠间隔 |
+ level | Integer | 风险等级,0: 高风险 1: 中风 2: 低风险 3: 正常 4: 检测失败 |
phoneHash | Float | sha256加密的手机号 |
deviceId | Float | 设备 ID |
回调请求示例
Plain Text
1审核中:
2{
3 "log_id": 16415253958306825,
4 "error_code": 282008,
5 "error_msg": "task not complete"
6}
7审核完成:
8{
9 "log_id": 16415253958306825,
10 "conclusion": "不合规",
11 "conclusionType": 2,
12 "audioId": "test_audioId_85643",
13 "account": "test_account_room_001",
14 "rawText": [
15 "加个微信慢慢聊,关注公众号百万资源等你来,我们产品是第一品牌,你吃一瓶安眠药就可以睡"
16 ],
17 "taskId": "e8ae004e-a8de-46fe-91b1-581a36310b40",
18 "taskDuration": 10,
19 "data": [
20 {
21 "conclusion": "不合规",
22 "conclusionType": 2,
23 "endTime": 9740,
24 "startTime": 0,
25 "text": "加个微信慢慢聊,关注公众号百万资源等你来,我们产品是第一品牌,你吃一瓶安眠药就可以睡",
26 "auditData": [
27 {
28 "hits": [
29 {
30 "wordHitPositions": [
31 {
32 "positions": [
33 [
34 32,
35 34
36 ]
37 ],
38 "label": "100200",
39 "keyword": "安眠药"
40 }
41 ],
42 "probability": 1.0,
43 "datasetName": "百度默认文本反作弊库",
44 "words": [
45 "安眠药"
46 ],
47 "modelHitPositions": [
48 [
49 0,
50 39,
51 0.7971
52 ]
53 ]
54 }
55 ],
56 "msg": "存在暴恐违禁不合规",
57 "subType": 1,
58 "type": 12
59 },
60 {
61 "hits": [
62 {
63 "wordHitPositions": [
64 {
65 "positions": [
66 [
67 9,
68 11
69 ],
70 [
71 2,
72 3
73 ]
74 ],
75 "label": "400200",
76 "keyword": "公众号&微信"
77 },
78 {
79 "positions": [
80 [
81 9,
82 11
83 ],
84 [
85 7,
86 8
87 ]
88 ],
89 "label": "400200",
90 "keyword": "公众号&关注"
91 },
92 {
93 "positions": [
94 [
95 7,
96 8
97 ],
98 [
99 2,
100 3
101 ]
102 ],
103 "label": "400200",
104 "keyword": "关注&微信"
105 }
106 ],
107 "probability": 1.0,
108 "datasetName": "百度默认文本反作弊库",
109 "words": [
110 "公众号 微信",
111 "公众号 关注",
112 "关注 微信"
113 ],
114 "modelHitPositions": [
115 [
116 0,
117 39,
118 0.9734
119 ]
120 ]
121 }
122 ],
123 "msg": "存在恶意推广不合规",
124 "subType": 4,
125 "type": 12
126 }
127 ]
128 }
129 ],
130 "taskInfo": {
131 "taskDuration": 10
132 }
133}
回调响应
接口返回:
参数名称 | 数据类型 | 描述 |
---|---|---|
errorCode | Integer | 响应码,为0表示回调成功 |