客户案例实操 – 抖音大段文本分析输出

客户案例实操 – 抖音大段文本分析输出

客户需求:把抖音用户语音转文本后的内容分析完,按照问题和答案的方式来汇总,这样方便用户去阅读学习。

Coze操作步骤:

  1. 考虑到用户发出的是超长文本,所以首先需要用到代码处理文本分拆。
  2. 工作流中选择code
  3. image

    由于客户上传的数据是txt,因此通过拆分txt文档块开始,公开原始代码:

  4. async function main({ params }: Args): Promise<Output> {
        const input = params.input;
        const maxTokens = 2000;
        const text: Array<{[key: string]: string}> = [];
    
        let start = 0;
        let segmentNumber = 1;
        while (start < input.length) {
            let end = start + maxTokens;
            if (end > input.length) {
                end = input.length;
            } else {
                // 尝试在一个完整的词或句子结束处截断
                while (end > start && !input[end - 1].match(/[\s.,!?;]/)) {
                    end--;
                }
                if (end === start) {
                    // 如果没有找到合适的截断点,就强制在2000个字符处截断
                    end = start + maxTokens;
                }
            }
    
            const segmentKey = `text${segmentNumber.toString().padStart(2, '0')}`;
            text.push({ [segmentKey]: input.slice(start, end) });
            
            start = end;
            segmentNumber++;
        }
    
        return { text };
    }

    5. 第二步骤很简单了,就是用LLM去分析这些文本,具体LLM提示词客户未同意不公开,但是也是比较简单的。

    1. LLM输入效果
    2. image

      LLM 输出效果

    3. image

6. 最后,我们把输出的json文件转换为excel格式,任务就完成了

image

 

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容