当前位置: 首页 > news >正文

GraphRAG【部署 01】Linux环境安装部署GraphRAG并使用Ollama本地大模型

话不多说先上 GitHub 文档地址https://microsoft.github.io/graphrag/get_started/本次在 Linux 环境下进行一次安装测试环境说明# 系统NAMEopenEulerVERSION22.03 (LTS-SP3)# conda版本conda23.7.2服务器上没有 GPU 导致创建索引的时候不是超时就是报错配置信息反复修改多次才创建成功。Linux环境安装部署GraphRAG1.环境搭建1.1 创建虚拟环境1.2 安装1.3 初始化1.4 下载样本文件1.5 设置工作区变量1.5 创建索引2.测试3.总结1.环境搭建1.1 创建虚拟环境官网的步骤是create a project space and python virtual environment to installgraphrag.# 1.Create Project Spacemkdirgraphrag_quickstartcdgraphrag_quickstart python-mvenv .venv# 2.Activate Python Virtual Environment - Unix/MacOSsource.venv/bin/activate# 3.Activate Python Virtual Environment - Windows.venv\Scripts\activate我使用的是AnacondaAnaconda 的安装操作这里不再赘述部署文件提示 GraphRAG requiresPython 3.10 - 3.12。本次使用之前创建的虚拟环境AutoGenStudio。# 创建虚拟环境conda create-nAutoGenStudiopython3.101.2 安装python-mpipinstallgraphrag# 安装成功的版本autograd1.8.0 pypi_0 pypi1.3 初始化graphrag init官网的说明信息已经过时了This will create two files,.envandsettings.yaml, and a directoryinput, in the current directory.inputLocation of text files to process withgraphrag..envcontains the environment variables required to run the GraphRAG pipeline. If you inspect the file, you’ll see a single environment variable defined,GRAPHRAG_API_KEYAPI_KEY. ReplaceAPI_KEYwith your own OpenAI or Azure API key.settings.yamlcontains the settings for the pipeline. You can modify this file to change the settings for the pipeline.1.4 下载样本文件# 创建目录mkdirinput# 下载样本文件curlhttps://www.gutenberg.org/cache/epub/24022/pg24022.txt-o./input/book.txt样本文件是纯英文的为测试中文又上传了一本《塔木德》tamude.txt(1.75MB)但是初始化 Graph 数据太慢了最终使用了一个文件里边只有一句话张三是小学语文老师他的哥哥张三丰是中学数学老师他们都在郑州。。1.5 设置工作区变量修改配置文件settings.yaml里的模型相关信息原始配置如下# 模型配置models: default_chat_model: type: chat model_provider: openai auth_type: api_key# or azure_managed_identityapi_key:${GRAPHRAG_API_KEY}# set this in the generated .env file, or remove if managed identitymodel: gpt-4-turbo-preview# api_base: https://instance.openai.azure.com# api_version: 2024-05-01-previewmodel_supports_json:true# recommended if this is available for your model.concurrent_requests:25async_mode: threaded# or asyncioretry_strategy: exponential_backoff max_retries:10tokens_per_minute: null requests_per_minute: null default_embedding_model: type: embedding model_provider: openai auth_type: api_key api_key:${GRAPHRAG_API_KEY}model: text-embedding-3-small# api_base: https://instance.openai.azure.com# api_version: 2024-05-01-previewconcurrent_requests:25async_mode: threaded# or asyncioretry_strategy: exponential_backoff max_retries:10tokens_per_minute: null requests_per_minute: null# 文本分块chunks: size:1200overlap:100group_by_columns:[id]# 图相关配置extract_graph: model_id: default_chat_model prompt:prompts/extract_graph.txtentity_types:[organization,person,geo,event]max_gleanings:1extract_graph_nlp: text_analyzer: extractor_type: regex_english# [regex_english, syntactic_parser, cfg]async_mode: threaded# or asyncio配置使用 Ollama 部署的两个本地模型本地测试根据 GPU 情况尽量选择小一点儿的模型NAME ID SIZE MODIFIED nomic-embed-text:latest 0a109f422b47274MB9months ago qwen2.5:0.5b a8b0c5157701397MB12months ago# 确认本地Ollama服务可用curlhttp://localhost:11434/api/tags修改配置为# 模型配置【本地模型参数配置要低一些】models: default_chat_model: type: chat model_provider: ollama auth_type: api_key api_key: dummy_key model: qwen2.5:0.5b api_base: http://localhost:11434 model_supports_json:trueconcurrent_requests:1async_mode: threaded retry_strategy: exponential_backoff max_retries:1request_timeout:1800tokens_per_minute: null requests_per_minute: null default_embedding_model: type: embedding model_provider: ollama auth_type: api_key api_key: dummy_key model: nomic-embed-text:latest api_base: http://localhost:11434 concurrent_requests:1request_timeout:1800async_mode: threaded retry_strategy: exponential_backoff max_retries:1tokens_per_minute: null requests_per_minute: null# 文本分块【本地测试的时候尽量小】chunks: size:64overlap:8group_by_columns:[id]# 抽取实体extract_graph: extractor_type: nlp extract_graph_nlp: text_analyzer: extractor_type: regex_english async_mode: asyncio1.5 创建索引graphrag index创建索引的过程中会有日志信息输出 logs/indexing-engine.log 以下报错的原因是配置信息api_base: http://localhost:11434/v1是错误的不能带/v1。ERROR - graphrag.language_model.providers.litellm.services.retry.exponential_retry - ExponentialRetry: Request failed, retrying,retries1,delay2.0,max_retries10,exceptionlitell m.APIConnectionError: OllamaException -404page not found Traceback(most recent call last):... httpx.HTTPStatusError: Client error404 Not Foundforurlhttp://localhost:11434/v1/api/generateFormoreinformation check: https://developer.mozilla.org/en-US/docs/Web/HTTP/Status/404创建索引完成graphrag.cli.index - All workflows completed successfully.2.测试测试的文件内容是张三是小学语文老师他的哥哥张三丰是中学数学老师他们都在郑州。全局查询# 问题1graphrag query-mglobal-q郑州有几个老师?# 输出结果对不起我无法回答这个问题。根据提供的信息我们只知道有两个老师在郑州工作但没有提供具体的数量或详细的信息。如果您有其他关于郑州教师的疑问请告诉我我会尽力帮助您解答。# 问题2graphrag query-mglobal-q郑州的这两个老师什么关系?# 输出结果### Response:这两个老师是同一家公司的同事共同工作在同一个城市。他们都是小学语文教师从事相同的职业和地点。他们都是在中国的学校里教书的老师拥有相同的地理位置。他们都是中国的小学语文教师具有相似的专业背景。 ---### Analyst Reports (Descending Order of Importance)#### Analyst 1**Importance Score:100** 这两个老师是同一家公司的同事共同工作在同一个城市。 **Importance Score:85** 他们都是小学语文教师从事相同的职业和地点。 **Importance Score:75** 他们都是在中国的学校里教书的老师拥有相同的地理位置。 **Importance Score:60** 他们都是中国的小学语文教师具有相似的专业背景。 ---### Explanation根据分析师报告的内容我们可以得出以下结论1. **同事关系**这两个老师是同一家公司的同事共同工作在同一个城市。2. **职业和地点**他们都是小学语文教师从事相同的职业和地点。这意味着他们在同一所学校或教育机构中工作。3. **地理位置**他们都是在中国的学校里教书的老师拥有相同的地理位置。这表明他们的工作地点是相同的。4. **专业背景**他们都是中国的小学语文教师具有相似的专业背景。 这些信息共同说明了这两个老师之间的关系和他们在教育领域的相同之处。通过分析我们可以得出结论这两个老师在职业、地点和专业领域上都是一致的因此他们是同事关系。本地查询# 问题1graphrag query-mlocal-q郑州有几个老师?# 输出结果根据提供的数据郑州市目前没有具体的教师数量信息。但是我们可以从其他相关数据中推断出一些可能的情况。 首先我们查看了“Entities”表中的记录发现有两所学校的信息一个是“ZHANG SONG FENG”另一个是“ZHANG SONG”。这两个实体分别对应的是“张三丰”和“张三”的描述。这表明可能存在多个老师在郑州工作但具体数量无法从现有数据中得知。 此外“Relationships”表中的记录显示了两对教师之间的关系一对是“ZHANG SONG FENG”和“ZHANG SONG”另一对是“ZHANG SONG FENG”和“张三”。这些信息表明可能存在多个老师在郑州工作但具体数量也无法从现有数据中得知。 综上所述根据提供的数据郑州市目前没有具体的教师数量信息。但是我们可以推测可能有多个老师在郑州工作但由于缺乏确切的数字我们无法给出一个准确的答案。# 问题2graphrag query-mlocal-q郑州的这两个老师什么关系?# 输出结果在提供的数据中我们无法直接找到关于“郑州的两个老师”之间具体关系的信息。然而我们可以从其他相关数据中推断出一些可能的关系。 根据“Entities”表中的信息“ZHANG SONG FENG”和“ZHANG SONG”都是描述为“小学语文老师”的人。这表明这两个老师都从事教育工作并且他们都在同一个城市郑州工作。因此我们可以推测 - **Zhao Song Feng 和 Zhao Song 是同一个人**因为他们的职业是相同的小学语文教师并且他们都位于同一个城市郑州。这种职业和地理位置上的重合可能意味着他们是同一人。 - **Zhao Song Feng 和 Zhao Song 有共同的教育背景**他们都是在同一个城市工作的语文老师这表明他们在教育领域有着相似的经历或知识基础。 综上所述“郑州的这两个老师”可能是同一个人即“Zhao Song Feng”。他们的职业和地理位置上的重合可能意味着他们是同一人。3.总结官网的部署流程并非最新的没有 GPU 的服务器初始化及问答的效果都不好其他原因模型小、知识图谱索引质量低、文本质量差
http://www.zskr.cn/news/1407687.html

相关文章:

  • 从FLV到HTML5:flv.js如何突破浏览器限制实现高效直播播放
  • 如何永久备份微信聊天记录?WeChatMsg完整数据留存方案指南
  • 个人工作室可以开通GEO优化吗
  • 拒绝浓重机器味!2026毕业论文降AI实操:打破模型底层逻辑
  • Agent 面试,项目是 20 分,讲项目是 80 分
  • GEO自然优化和付费推广区别
  • 2026西安财税咨询机构深度测评:3家主流财税对比! - 小柏云
  • 163MusicLyrics:3分钟掌握网易云和QQ音乐LRC歌词获取技巧
  • 第3讲 【大模型基础1】AI、机器学习、深度学习与大模型的关系
  • 目前口碑好的家政保洁品牌推荐
  • 别再用老掉牙的猫狗数据集了!用TensorFlow 2.1+Python 3.6,从数据清洗到模型调优的完整避坑指南
  • 2026年 大连电脑维修推荐榜:沙河口笔记本/台式机/服务器/戴尔联想惠普等品牌维修,专业高效口碑之选 - 品牌企业推荐师(官方)
  • 南沙大件搬迁怕摔?专业搬家公司防护运输更安全 - 从来都是英雄出少年
  • 视频去水印无损工具推荐:去水印后和原视频一样,2026实测最有效的方法 - 体验家
  • 【ChatGPT客户旅程地图实战指南】:20年CX专家亲授5大关键触点建模法,错过再等一年
  • 短视频团队已全面切换:ChatGPT脚本写作效能实测——人均日产能提升3.8倍,完播率平均+27.6%
  • 【限时公开】ChatGPT谜题响应率提升300%的底层协议——基于LLM推理链的6层提示压缩术
  • ChatGPT婚礼策划辅助落地全案(含提示词库+风险预警清单):已验证服务872对新人的真实数据复盘
  • 抖音内容采集终极指南:5分钟掌握批量下载的完整方案
  • vSAN双活数据中心延迟标准详解!阈值与优化规范
  • 第 1 篇:MCP 是什么?——AI 世界的“万能插座“
  • 低成本栅极电压调制方案:实现功率器件主动热控制与效率优化
  • 基于VDBA的无电阻浮地电感仿真器设计及其在滤波器中的应用
  • 2026年Q2昆明区域美术培训行业发展现状与本土优质机构梳理分析 - 云南美术头条
  • WorkBuddy实战:用MCP协议让AI助手对接企业知识库
  • 大模型基础课:模型、参数、训练与推理的深度解析
  • 任天堂3DS模拟器Citra:在电脑上重温经典游戏的终极指南
  • 5G NR 双连接与载波聚合:PCell、SCell、PScell、SpCell 角色全解析
  • 预计2032年全球冷凝水去除泵市场将达到7.64亿美元
  • 国家中小学智慧教育平台电子课本下载终极指南:5分钟获取PDF教材的完整教程