文本检测-文本内容审核-文本过滤接口如何用PHP调用?
一、什么是文本检测接口呢?
文本内容审核过滤,提供对敏感事件、违规词语及监管要求封禁词语的识别审核能力,包含海量历史数据,有效过滤违禁违规、恶意推广、低俗辱骂、低质灌水、广告法审核,该接口应用场景广泛,适用于用户评价过滤,注册信息筛查,文章内容审核。
二、文本检测接口适用哪些场景?
它在多个领域和场景中都有广泛的应用。以下是文本检测接口的主要适用场景:文本分类与标签化
-
新闻分类:
-
将新闻文章自动分类为政治、经济、体育、娱乐等类别,便于内容管理和推荐。
-
适用于新闻网站、内容聚合平台。
-
-
邮件分类:
-
将邮件自动分类为工作、个人、广告、垃圾邮件等,提高邮件管理效率。
-
适用于企业邮箱、个人邮箱系统。
-
关键词提取与摘要生成
-
-
关键词提取:
-
从长文本中提取核心关键词,便于快速了解文本主题。
-
适用于搜索引擎优化(SEO)、内容分析、知识管理等。
-
-
文本摘要:
-
自动生成文本的简短摘要,帮助用户快速获取核心信息。
-
适用于新闻阅读、文档管理、学术研究等。
-
三、如何用PHP进行接口调用?
下面我们以阿里云云市场接口为例:
具体示例代码:
接口地址:https://market.aliyun.com/apimarket/detail/cmapi00069829#sku=yuncode6382900002
<?php
$host = "https://kzwordc.market.alicloudapi.com";
$path = "/api/text/check";
$method = "POST";
$appcode = "你自己的AppCode";
$headers = array();
array_push($headers, "Authorization:APPCODE " . $appcode);
//根据API的要求,定义相对应的Content-Type
array_push($headers, "Content-Type".":"."application/json; charset=UTF-8");
$querys = "text=%E7%9C%8B%E7%89%87%E5%8A%A0VX%EF%BC%9Abarcelone020%EF%BC%8C%E4%BB%A4%E8%AE%A1%E5%88%92%E9%A3%8E%E6%B5%81%E5%BE%80%E4%BA%8B";
$bodys = "null";
$url = $host . $path . "?" . $querys;
$curl = curl_init();
curl_setopt($curl, CURLOPT_CUSTOMREQUEST, $method);
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_HTTPHEADER, $headers);
curl_setopt($curl, CURLOPT_FAILONERROR, false);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
curl_setopt($curl, CURLOPT_HEADER, true);
if (1 == strpos("$".$host, "https://"))
{
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
}
curl_setopt($curl, CURLOPT_POSTFIELDS, $bodys);
var_dump(curl_exec($curl));
?>
正确返回示例:
{
"msg": "成功",
"success": true,
"code": 200,
"data": {
"conclusion": "不合规",//合规、不合规、疑似、审核失败
"log_id": 17406573039013934,
"data": [
{
"conclusion": "不合规",
"msg": "存在文本色情不合规",
"subType": 2,
"conclusionType": 2,
"type": 12
},
{
"conclusion": "不合规",
"msg": "存在政治敏感不合规",
"subType": 3,
"conclusionType": 2,
"type": 12
},
{
"conclusion": "不合规",
"msg": "存在广告不合规",
"subType": 4,//审核子类型,此字段需参照type主类型字段决定其含义:当type=11时subType取值含义:0:官方默认违禁词库
当type=12时subType取值含义:0:低质灌水、2:文本色情、4:恶意推广、5:低俗辱骂、7:隐私信息
"conclusionType": 2,//1.合规,2.不合规,3.疑似,4.审核失败
"type": 12//11:官方违禁词库、12:文本反作弊
}
],
"conclusionType": 2 //1.合规,2.不合规,3.疑似,4.审核失败
}