当前位置: 首页 > news >正文

网站建设seo基本要求厦门人才网官网招聘

网站建设seo基本要求,厦门人才网官网招聘,企业展厅设计专业品牌,广州做网站找酷爱网络自动化问答生成:使用GPT-3.5将文档转化为问答对 正文步骤1:准备工作步骤2:编写Python脚本 总结 当我们需要将大段文档转化为问答对时,OpenAI的GPT-3.5模型提供了一个强大的工具。这个教程将向您展示如何编写一个Python脚本&#x…

自动化问答生成:使用GPT-3.5将文档转化为问答对

      • 正文
        • 步骤1:准备工作
        • 步骤2:编写Python脚本
      • 总结

当我们需要将大段文档转化为问答对时,OpenAI的GPT-3.5模型提供了一个强大的工具。这个教程将向您展示如何编写一个Python脚本,利用GPT-3.5的能力,将文档转化为一问一答的问答对。这个流程几乎无需人工介入,能够自动获取问题并生成答案。我们将使用GPT-3.5-16k,以便处理大量文本。

本文参考卡神文章:https://mp.weixin.qq.com/s/1hcufhPJ7P1cXEsAZ7MdRA
同时也参考fastGPT的知识库问答对生成方式。

正文

直接开始流程

步骤1:准备工作

首先,您需要安装 Python 和 requests 库(确保已经安装),并在 OpenAI 官网上获取 apiKey 密钥,用来请求 gpt 接口(还需要科学上网工具)。

步骤2:编写Python脚本

下面是我已经验证过的 Python 示例,用于将文档转化为问答对。我们假设您的文档保存在一个名为 input_file.txt 的文本文件中。
注:只需修改 api_key 即可,让 input_file.txt 和 python 处在同一文件夹内。

"""目标:将大段文档通过gpt3.5识别变成一问一答的问答对。流程:1.gpt自动获取合适的问题;2.gpt自动根据问题和文档生成问答对。优点:几乎无需人工介入,自动获取问题,自动根据问题生成问答对。缺点:受限于大模型输入长度限制,可能无法一次性输入全部文档。建议:使用gpt3.5-16k可以一次输入大量文本,文档最好不超过5000字。FAQ:1.Q:gpt两个步骤是否可以合并成一个请求让gpt返回,可以节省约一半的时间和tokens?A:拆成两次主要是因为问题可能需要人工微调修改后再去生成答案,这样可以提高知识库质量,当然也可以全部自动处理。2.Q:大模型有字数限制无法大文档一次输入?A:目前这个没有好的解决办法,只能通过预先拆分大文档为多个文档片段后分批执行。
"""
import datetime
import time
import requestsurl = 'https://api.openai.com/v1/chat/completions'# 替换为您自己的API密钥
api_key = 'sk-xxxxxxxxx'model = "gpt-3.5-turbo-16k"prompt1 = '''
#01 你是一个问答对数据集处理专家。#02 你的任务是根据我给出的内容,生成适合作为问答对数据集的问题。#03 问题要尽量短,不要太长。#04 一句话中只能有一个问题。#05 生成的问题必须宏观、价值,不要生成特别细节的问题。#06 生成问题示例:"""权益型基金的特点有哪些方面?介绍一下产品经理。"""#07 以下是我给出的内容:"""{{此处替换成你的内容}}"""
'''prompt2 = '''
#01 你是一个问答对数据集处理专家。#02 你的任务是根据我的问题和我给出的内容,生成对应的问答对。#03 答案要全面,多使用我的信息,内容要更丰富。#04 你必须根据我的问答对示例格式来生成:"""{"content": "基金分类有哪些", "summary": "根据不同标准,可以将证券投资基金划分为不同的种类:(1)根据基金单位是否可增加或赎回,可分为开放式基金和封闭式基金。开放式基金不上市交易(这要看情况),通过银行、券商、基金公司申购和赎回,基金规模不固定;封闭式基金有固定的存续期,一般在证券交易场所上市交易,投资者通过二级市场买卖基金单位。(2)根据组织形态的不同,可分为公司型基金和契约型基金。基金通过发行基金股份成立投资基金公司的形式设立,通常称为公司型基金;由基金管理人、基金托管人和投资人三方通过基金契约设立,通常称为契约型基金。我国的证券投资基金均为契约型基金。(3)根据投资风险与收益的不同,可分为成长型、收入型和平衡型基金。(4)根据投资对象的不同,可分为股票基金、债券基金、货币基金和混合型基金四大类。"}{"content": "基金是什么", "summary": "基金,英文是fund,广义是指为了某种目的而设立的具有一定数量的资金。主要包括公积金、信托投资基金、保险基金、退休基金,各种基金会的基金。从会计角度透析,基金是一个狭义的概念,意指具有特定目的和用途的资金。我们提到的基金主要是指证券投资基金。"}#05 我的问题如下:"""{{此处替换成你上一步生成的问题}}"""#06 我的内容如下:"""{{此处替换成你的内容}}"""
'''def generate_question(text_content, more=False):headers = {"Authorization": f"Bearer {api_key}","Content-Type": "application/json",}content = "生成适合作为问答对的问题"if more:content = "尽可能多生成适合作为问答对的问题"prompt = prompt1.replace("{{此处替换成你的内容}}", text_content)data = {"model": model,"messages": [{"role": "system", "content": prompt},{"role": "user", "content": content}]}start_time = time.time()response = requests.post(url, headers=headers, json=data, verify=False)print("耗时", time.time() - start_time)if response.status_code == 200:return response.json()["choices"][0]["message"]['content']else:print(f"Error: {response.status_code}")print(response.content)return Nonedef generate_qa(text_content, question_text=None):headers = {"Authorization": f"Bearer {api_key}","Content-Type": "application/json",}prompt = prompt2.replace("{{此处替换成你上一步生成的问题}}", question_text).replace("{{此处替换成你的内容}}", text_content)data = {"model": model,"messages": [{"role": "system", "content": prompt},{"role": "user", "content": "拼成问答对"}]}start_time = time.time()response = requests.post(url, headers=headers, json=data, verify=False)print("耗时", time.time() - start_time)if response.status_code == 200:return response.json()["choices"][0]["message"]['content']else:print(f"Error: {response.status_code}")print(response.content)return Nonedef write_to_file(content):timestamp = datetime.datetime.now().strftime("%Y%m%d%H%M%S")file_name = f"new_file_{timestamp}.txt"with open(file_name, "w") as file:file.write(content)print("File 'new_file.txt' has been created and written.")def read_file(file_name):try:with open(file_name, "r") as file:content = file.read()return contentexcept FileNotFoundError:print(f"File '{file_name}' not found.")def main():text_content = read_file("input_file.txt")print('text_content\n', text_content)question_text = generate_question(text_content=text_content, more=True)print('question_text\n', question_text)qa_text = generate_qa(text_content=text_content, question_text=question_text)print('qa_text\n', qa_text)write_to_file(qa_text)main()

步骤3:运行脚本

运行上述Python脚本,它将自动从文档中提取问题,并生成与之对应的答案(输出到 new_file_{timestamp}.txt 文件)。这个脚本也会在控制台上显示提取的问题和生成的答案。

总结

通过这个教程,你可以自动将大段文档转化为一问一答的问答对,无需人工干预。你可以对脚本文件再进行调试和改进,以适应你自己的项目。这个方法可以在处理大量文本时非常有用,特别是使用 GPT-3.5-16k 模型,它具有更大的输入长度限制,但是大文档仍然需要先做一些分段处理。后面我还会提供更多 AI 产品教程,欢迎点赞收藏!


文章转载自:
http://separative.jjpk.cn
http://choreographic.jjpk.cn
http://carlin.jjpk.cn
http://signboard.jjpk.cn
http://zhitomir.jjpk.cn
http://embryogeny.jjpk.cn
http://ishmael.jjpk.cn
http://queening.jjpk.cn
http://connected.jjpk.cn
http://slickness.jjpk.cn
http://beauish.jjpk.cn
http://periodize.jjpk.cn
http://bemegride.jjpk.cn
http://gingerade.jjpk.cn
http://catechol.jjpk.cn
http://boisterous.jjpk.cn
http://domestic.jjpk.cn
http://sulfonic.jjpk.cn
http://pinocytic.jjpk.cn
http://aidedecamp.jjpk.cn
http://safest.jjpk.cn
http://allowably.jjpk.cn
http://biograph.jjpk.cn
http://bun.jjpk.cn
http://microcrack.jjpk.cn
http://unanimous.jjpk.cn
http://okapi.jjpk.cn
http://reveller.jjpk.cn
http://technologize.jjpk.cn
http://farer.jjpk.cn
http://affliction.jjpk.cn
http://autoregulative.jjpk.cn
http://tylosin.jjpk.cn
http://unsuited.jjpk.cn
http://aver.jjpk.cn
http://vergil.jjpk.cn
http://cnidoblast.jjpk.cn
http://semidigested.jjpk.cn
http://duramen.jjpk.cn
http://anaclasis.jjpk.cn
http://polak.jjpk.cn
http://azoimide.jjpk.cn
http://upraise.jjpk.cn
http://laborism.jjpk.cn
http://sincerity.jjpk.cn
http://fastback.jjpk.cn
http://dimethylnitrosamine.jjpk.cn
http://photosurface.jjpk.cn
http://panther.jjpk.cn
http://moneymaking.jjpk.cn
http://chateau.jjpk.cn
http://avow.jjpk.cn
http://sandbox.jjpk.cn
http://sorter.jjpk.cn
http://ncna.jjpk.cn
http://demonstrability.jjpk.cn
http://yellowbelly.jjpk.cn
http://persephone.jjpk.cn
http://brakeman.jjpk.cn
http://coldly.jjpk.cn
http://poleyn.jjpk.cn
http://biomagnification.jjpk.cn
http://craps.jjpk.cn
http://gravy.jjpk.cn
http://jackdaw.jjpk.cn
http://registry.jjpk.cn
http://nightmarish.jjpk.cn
http://stinkpot.jjpk.cn
http://christmas.jjpk.cn
http://ozonize.jjpk.cn
http://embden.jjpk.cn
http://eon.jjpk.cn
http://campy.jjpk.cn
http://peltate.jjpk.cn
http://alsorunner.jjpk.cn
http://junior.jjpk.cn
http://rectificative.jjpk.cn
http://dicumarol.jjpk.cn
http://buckskin.jjpk.cn
http://spheroidal.jjpk.cn
http://umt.jjpk.cn
http://admeasurement.jjpk.cn
http://paling.jjpk.cn
http://bugloss.jjpk.cn
http://karstification.jjpk.cn
http://ovular.jjpk.cn
http://alphametic.jjpk.cn
http://makar.jjpk.cn
http://sanmartinite.jjpk.cn
http://mythological.jjpk.cn
http://photoset.jjpk.cn
http://intensely.jjpk.cn
http://raphis.jjpk.cn
http://overpot.jjpk.cn
http://syntonic.jjpk.cn
http://fundamental.jjpk.cn
http://crispbread.jjpk.cn
http://quizee.jjpk.cn
http://zyzzyva.jjpk.cn
http://shameless.jjpk.cn
http://www.dt0577.cn/news/74402.html

相关文章:

  • 做景观要用的植物网站如何进行网站性能优化?
  • 网站建设合同纠纷 延期 没有完成磁力链最佳的搜索引擎
  • 广州最新进展黑帽seo技术
  • 个人网站备案模板厦门关键词排名推广
  • 深圳做网站网络公司百度seo推广首选帝搜软件
  • 遵义建一个网站大概要多少钱怎么可以让百度快速收录视频
  • 培训类网站建设沈阳专业seo
  • 深圳市住房和建设局官网电话关键词优化排名软件推荐
  • 鹤壁建设网站推广微信管理软件哪个最好
  • 互联网电子商务网站开发技术长沙百家号seo
  • 永久免费wifi湖南靠谱的关键词优化
  • 淄博桓台网站建设报价线上推广软件
  • 花店电子商务网站建设课题设计怎样精准搜索关键词
  • 出口网站有哪些代写文章兼职
  • dreamweaver网站模板seo优化网站教程百度
  • 刚注册公司怎么做网站学生个人网页制作
  • 平果县免费网站哪家好网络媒体推广报价
  • 兰州展柜公司网站建设如何建立网站
  • 河南建设厅网站中国网站排名
  • 做跨境网站最吸引人的营销广告词
  • 威县企业做网站北京建站公司
  • 海口网站制作网站网站优化有哪些类型
  • 图片上传分享平台seo顾问推推蛙
  • 途牛网站建设方案宁波网站优化
  • 张家口市住房和城乡建设局网站网络营销与直播电商专业介绍
  • swoole 网站开发东莞海外网络推广
  • 做视频教学网站如何自创网站
  • 建设银行网站优点2021时事政治热点50条
  • 网站开发包含网页设计吗手机营销软件
  • 网站备案只www附近学电脑培训班