当前位置: 首页 > article >正文

下载分享抖音视频并转成文本

思路

  1. 将分享的链接转义成可以正常链接。
  2. 通过链接去找到对应的视频链接。
  3. 在通过返回的html。解析里面视频的资源链接在playAddr字段里面。
  4. 拿到链接后转义urlPath即可获取到资源信息。
  5. 下载视频。
  6. 科大讯飞语音转文本。
  7. 处理json保存到本地。

部分代码

获取抖音链接:

            String url = "6.43 复制打开抖音,看看【白浪源烟薯种植基地的作品】一旦找对了原产地,就很难在换其他家了,在我们家买过... https://v.douyin.com/ikagBCYn/ I@V.Lw mqe:/ 05/30  ";
            //过滤链接,获取http连接地址
            url = decodeHttpUrl(url);
            log.info("过滤后的链接地址:{}", url);
            //发起请求
            HttpResponse responseHref = HttpRequest.get(url)
                    .header("User-Agent", USER_AGENT)
                    .execute();
            String strUrlHref = responseHref.body();
            log.info("html地址:{}", strUrlHref);
            // 正则表达式用于匹配"video/"后面跟随的一系列数字
            Pattern pattern = Pattern.compile(regex);
            Matcher matcherUrlHref = pattern.matcher(strUrlHref);
            String videoId = null;

科大讯飞:

    private static String upload(String filePath) throws SignatureException, FileNotFoundException {
        HashMap<String, Object> map = new HashMap<>(16);
        File audio = new File(filePath);
        String fileName = audio.getName();
        long fileSize = audio.length();
        map.put("appId", appid);
        map.put("fileSize", fileSize);
        map.put("fileName", fileName);
        map.put("duration", "200");
        LfasrSignature lfasrSignature = new LfasrSignature(appid, keySecret);
        map.put("signa", lfasrSignature.getSigna());
        map.put("ts", lfasrSignature.getTs());

        String paramString = HttpUtil.parseMapToPathParam(map);
        log.info("upload paramString:" + paramString);

        String url = HOST + "/v2/api/upload" + "?" + paramString;
        log.info("upload_url:" + url);
        String response = HttpUtil.iflyrecUpload(url, new FileInputStream(audio));

        log.info("upload response:" + response);
        return response;
    }

    private static String getResult(String orderId, String writerFileNameAndPath) throws SignatureException, InterruptedException, IOException {
        HashMap<String, Object> map = new HashMap<>(16);
        map.put("orderId", orderId);
        LfasrSignature lfasrSignature = new LfasrSignature(appid, keySecret);
        map.put("signa", lfasrSignature.getSigna());
        map.put("ts", lfasrSignature.getTs());
        map.put("appId", appid);
        map.put("resultType", "transfer,predict");

        String paramString = HttpUtil.parseMapToPathParam(map);
        String url = HOST + "/v2/api/getResult" + "?" + paramString;
        log.info("\nget_result_url:" + url);
        while (true) {
            String response = HttpUtil.iflyrecGet(url);
            JsonParse jsonParse = gson.fromJson(response, JsonParse.class);
            if (jsonParse.content.orderInfo.status == 4 || jsonParse.content.orderInfo.status == -1) {
                log.info("转换响应完成:" + response);
                write(response, writerFileNameAndPath);
                return response;
            } else {
                log.info("进行中...,状态为:" + jsonParse.content.orderInfo.status);
                //建议使用回调的方式查询结果,查询接口有请求频率限制
                Thread.sleep(7000);
            }
        }
    }

需要的后台私信我。


http://www.kler.cn/a/319545.html

相关文章:

  • 【学习】Fine-tuning知识汇总
  • [运维][Nginx]Nginx学习(1/5)--Nginx基础
  • 大语言模型:解锁自然语言处理的无限可能
  • 3D绘制动态爱心Matlab
  • 在 Ubuntu 上安装 `.deb` 软件包有几种方法
  • RT-DETR融合CVPR[2020]轻量化卷积模块Ghost Module模块
  • python爬虫:从12306网站获取火车站信息
  • 二分查找及变体
  • Linux系统(Ubuntu)(下载篇)
  • [SDX35+WCN6856]SDX35 +WCN6856 remount firmware出现失败问题原因及解决方案
  • 在线海外代理IP科普:代理主机与代理端口号的作用
  • MATLAB无线网络设计工具:从理论到实践
  • 任意长度并行前缀和 扫描算法 《PMPP》笔记
  • 接口加解密及数据加解密
  • 动手学深度学习(李沐)PyTorch 第 1 章 引言
  • 新零售社交电商系统的卷轴模式开发:重塑消费体验与商业生态
  • 格雷母线电缆头安装方法视频-武汉正向科技
  • MySQL自定义排序:使用ORDER BY FIELD实现灵活的数据排序
  • 【Java 问题】基础——Java 概述
  • 机器学习周报(9.16-9.22)-Pytorch学习(四)
  • 昇思量子计算系列教程-龙算法
  • 【Webpack】Hash 码
  • 15.10 在k8s部署grafana-deployment并导入k8s大盘
  • 计算机视觉的应用34-基于CV领域的人脸关键点特征智能提取的技术方法
  • N诺计算机考研-错题
  • 企业EMS -能源管理系统-能源在线监测平台