客户需求:把抖音用户语音转文本后的内容分析完,按照问题和答案的方式来汇总,这样方便用户去阅读学习。
Coze操作步骤:
- 考虑到用户发出的是超长文本,所以首先需要用到代码处理文本分拆。
- 工作流中选择code
-
由于客户上传的数据是txt,因此通过拆分txt文档块开始,公开原始代码:
-
async function main({ params }: Args): Promise<Output> { const input = params.input; const maxTokens = 2000; const text: Array<{[key: string]: string}> = []; let start = 0; let segmentNumber = 1; while (start < input.length) { let end = start + maxTokens; if (end > input.length) { end = input.length; } else { // 尝试在一个完整的词或句子结束处截断 while (end > start && !input[end - 1].match(/[\s.,!?;]/)) { end--; } if (end === start) { // 如果没有找到合适的截断点,就强制在2000个字符处截断 end = start + maxTokens; } } const segmentKey = `text${segmentNumber.toString().padStart(2, '0')}`; text.push({ [segmentKey]: input.slice(start, end) }); start = end; segmentNumber++; } return { text }; }
5. 第二步骤很简单了,就是用LLM去分析这些文本,具体LLM提示词客户未同意不公开,但是也是比较简单的。
- LLM输入效果
-
LLM 输出效果
6. 最后,我们把输出的json文件转换为excel格式,任务就完成了
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容