大伙可以构建自己的ai模型库，断网也可以用(合集转寄)-天马行空

mengjialou孟家楼村的

Fri Jun 5 09:52:34 2026 · #1

己构建了个人专业知识库，文档库变向量库，然后粗筛工具，精排工具，到这就可以不联网使用了，如果觉得精排输出太生硬，可以再连个最便宜的llm，把精排结果给llm,组织一下语言，再输出给你，以上过程需要写一个Python脚本，这个Python脚本你就当个agent用即可，去掉llm你不用花一毛钱，只是需要你把你们行业的电子书都搞到手. btw,这种模型库不知道是不是可以构建个人性格库，推演对手遇到某种情况会做什么决策 [upload=1][/upload]

FuZu富足

Sat Jun 6 10:32:04 2026 · #2

求带

【在 mengjialou 的大作中提到: 】 : 己构建了个人专业知识库，文档库变向量库，然后粗筛工具，精排工具，到这就可以不联网使用了，如果觉得精排输出太生硬，可以再连 ...

newidyunewiddyyuu

Sat Jun 6 10:33:53 2026 · #3

孟教授，教我

【在 mengjialou 的大作中提到: 】 : 己构建了个人专业知识库，文档库变向量库，然后粗筛工具，精排工具，到这就可以不联网使用了，如果觉得精排输出太生硬，可以再连个最便宜的llm，把精排结果给llm,组织一下语言，再输出给你，以上过程需要写一个Python脚本，这个Python脚本你就当个agent用即可，去掉llm你不用花一毛钱，只是需要你把你们行业的电子书都搞到手. : btw,这种模型库不知道是不是可以构建个人性格库，推演对手遇到某种情况会做什么决策

mengjialou孟家楼村的

Sun Jun 7 11:41:02 2026 · #4

昨天花了一天在Windows上搭建好了，可惜我的显卡不给力，问个问题也不能快速回复我，需要十几秒你想搭建如果是AMD显卡只能在Linux下搭建因为ROCm对Windows上的AMD显卡支持很差，12g显存十几秒就满了，显卡直接crash. 详细步骤没法写，细节太多，只能告诉你关键词，embed 是建向量库的，remark是精排，olloma里面有本地llm可以当汇总输出.

【在 newidyu 的大作中提到: 】 : 孟教授，教我

emulexemulex

Sun Jun 7 12:03:03 2026 · #5

个人专业知识库，文档库变向量库这个咋搞的？？我也想搞这个呢

【在 mengjialou (孟家楼村的) 的大作中提到: 】 : 己构建了个人专业知识库，文档库变向量库，然后粗筛工具，精排工具，到这就可以不联网使用了，如果觉得精排输出太生硬，可以再连个最便宜的llm，把精排结果给llm,组织一下语言，再输出给你，以上过程需要写一个Python脚本，这个Python脚本你就当个agent用即可，去掉llm你不用花一毛钱，只是需要你把你们行业的电子书都搞到手. : btw,这种模型库不知道是不是可以构建个人性格库，推演对手遇到某种情况会做什么决策

xuechenewman

Sun Jun 7 12:04:04 2026 · #6

这个对显卡要求很高的，花几千块钱买个显卡，还不如买token呢，对于一般的个人用户来说。当然如果你买显卡可以报销，那另当别论

【在 mengjialou 的大作中提到: 】 : 己构建了个人专业知识库，文档库变向量库，然后粗筛工具，精排工具，到这就可以不联网使用了，如果觉得精排输出太生硬，可以再连个最便宜的llm，把精排结果给llm,组织一下语言，再输出给你，以上过程需要写一个Python脚本，这个Python脚本你就当个agent用即可，去掉llm你不用花一毛钱，只是需要你把你们行业的电子书都搞到手. : btw,这种模型库不知道是不是可以构建个人性格库，推演对手遇到某种情况会做什么决策 : FROM 220.196.194.* [上海联通]

mengjialou孟家楼村的

Sun Jun 7 12:52:01 2026 · #7

也不会每次使用都建库，更新资料时候需要建库，那就耗费些时间，其他查询时候CPU足够了，也不一定非要用gpu，内存大一点即可最好48G,因为我发现我建库时候内存经常到33G

【在 xueche 的大作中提到: 】 : 这个对显卡要求很高的，花几千块钱买个显卡，还不如买token呢，对于一般的个人用户来说。当然如果你买显卡可以报销，那另当别论

newidyunewiddyyuu

Sun Jun 7 14:38:46 2026 · #8

给几个链接？谢谢谢谢

【在 mengjialou 的大作中提到: 】 : 昨天花了一天在Windows上搭建好了，可惜我的显卡不给力，问个问题也不能快速回复我，需要十几秒 : 你想搭建如果是AMD显卡只能在Linux下搭建因为ROCm对Windows上的AMD显卡支持很差，12g显存十几秒就满了，显卡直接crash. : 详细步骤没法写，细节太多，只能告诉你关键词，embed 是建向量库的，remark是精排，olloma里面有本地llm可以当汇总输出.

mengjialou孟家楼村的

Sun Jun 7 14:48:53 2026 · #9

水木不允许帖链接，你可以CSDN找一下，构建本地知识库模型，记录一下细节，搭起来挺麻烦

【在 newidyu 的大作中提到: 】 : 给几个链接？谢谢谢谢

zhyulilynskoler

Sun Jun 7 15:18:20 2026 · #10

可以整台苹果家的机器，我的mbp m1 32g当年都能跑32b的ds。

【在 mengjialou (孟家楼村的) 的大作中提到: 】 : 昨天花了一天在Windows上搭建好了，可惜我的显卡不给力，问个问题也不能快速回复我，需要十几秒 : 你想搭建如果是AMD显卡只能在Linux下搭建因为ROCm对Windows上的AMD显卡支持很差，12g显存十几秒就满了，显卡直接crash. : 详细步骤没法写，细节太多，只能告诉你关键词，embed 是建向量库的，remark是精排，olloma里面有本地llm可以当汇总输出. : 【在 newidyu 的大作中提到: 】

frzerofrzero

Sun Jun 7 15:19:33 2026 · #11

好像有人推荐过用ima搭建？

mengjialou孟家楼村的

Sun Jun 7 15:27:30 2026 · #12

如果你想找一个能跑在物理隔离局域网里、能处理涉密文件、完全不需要连外网的知识库系统，那需要的是基于 Ollama + AnythingLLM 这类工具自建的方案。而 ima 是一个功能强大的、用于处理非涉密文件的、提升个人或团队工作效率的互联网知识库工具。它的核心能力都来自云端。

【在 frzero 的大作中提到: 】 : 好像有人推荐过用ima搭建？

mengjialou孟家楼村的

Sun Jun 7 15:33:37 2026 · #13

你估计连什么是rag都没搞懂，就给人乱出主意了现在对话软件或者ai辅助编程都是一个agent客户端，llm在商家服务器那，结果通过网络输出给agent呈现给客户，本地rag是全套的llm，检索，推理，精排，资料数据向量库生成，都是在本地机器上跑，根本两码事，一个是买厂家东西用，一个是自己建厂

【在 zhyulily 的大作中提到: 】 : 可以整台苹果家的机器，我的mbp m1 32g当年都能跑32b的ds。

jansea沧浪客

Sun Jun 7 15:39:42 2026 · #14

我是用ollama搭了一个本地DS模型，但是笔记本没GPU，太慢了融合了好几种RAG哈，Wiki，graphicRAG还有AgenticRAG [upload=1][/upload]

【在 mengjialou 的大作中提到: 】 : 如果你想找一个能跑在物理隔离局域网里、能处理涉密文件、完全不需要连外网的知识库系统，那需要的是基于 Ollama + AnythingLLM 这类工具自建的方案。 : 而 ima 是一个功能强大的、用于处理非涉密文件的、提升个人或团队工作效率的互联网知识库工具。它的核心能力都来自云端。

jiangb江柏

Sun Jun 7 15:40:58 2026 · #15

硬件啥配置？多少钱？

【在 mengjialou 的大作中提到: 】 : 己构建了个人专业知识库，文档库变向量库，然后粗筛工具，精排工具，到这就可以不联网使用了，如果觉得精排输出太生硬，可以再连个最便宜的llm，把精排结果给llm,组织一下语言，再输出给你，以上过程需要写一个Python脚本，这个Python脚本你就当个agent用即可，去掉llm你不用花一毛钱，只是需要你把你们行业的电子书都搞到手. : btw,这种模型库不知道是不是可以构建个人性格库，推演对手遇到某种情况会做什么决策 : [upload=1][/upload]

zhyulilynskoler

Sun Jun 7 15:43:38 2026 · #16

不是本地部署吗？我理解错了？

【在 mengjialou (孟家楼村的) 的大作中提到: 】 : 你估计连什么是rag都没搞懂，就给人乱出主意了 : 现在对话软件或者ai辅助编程都是一个agent客户端，llm在商家服务器那，结果通过网络输出给agent呈现给客户，本地rag是全套的llm，检索，推理，精排，资料数据向量库生成，都是在本地机器上跑，根本两码事，一个是买厂家东西用，一个是自己建厂 : 【在 zhyulily 的大作中提到: 】 : : 可以整台苹果家的机器，我的mbp m1 32g当年都能跑32b的ds。

mengjialou孟家楼村的

Sun Jun 7 15:49:33 2026 · #17

只有AMD gre6750显卡，并且Windows的Rocm还不支持我的显卡，我自己电脑不想换Ubuntu，所以rag的所以模块都用CPU老，问一个问题得51秒才能回复给我

【在 jansea 的大作中提到: 】 : 我是用ollama搭了一个本地DS模型，但是笔记本没GPU，太慢了 : 融合了好几种RAG哈，Wiki，graphicRAG还有AgenticRAG : [upload=1][/upload]

mengjialou孟家楼村的

Sun Jun 7 15:51:39 2026 · #18

我就用自己台式机，凑合用，检索回复很慢的，因为我的gpu不行，起码上个4080吧，最好是nv的，AMD的支持有限，如果你gpu够好，CPU无所谓，内存倒是要大一些64g起步吧

【在 jiangb 的大作中提到: 】 : 硬件啥配置？多少钱？

yuctyuctdog

Sun Jun 7 15:59:40 2026 · #19

最新的trae就能干这个,dy上搜一下，有教程

【在 emulex 的大作中提到: 】 : 个人专业知识库，文档库变向量库 : 这个咋搞的？？ : 我也想搞这个呢

mengjialou孟家楼村的

Sun Jun 7 22:26:17 2026 · #20

不用olloma了，改用lmstudio支持我的AMD显卡，没有显卡就是很慢，显存太小也不行，我12g的显存只能用10b左右模型，不少14b模型都15g. 你说的这些rag是别人集成好了你直接用还是也需要你找工具一点点组成rag

【在 jansea 的大作中提到: 】 : 我是用ollama搭了一个本地DS模型，但是笔记本没GPU，太慢了 : 融合了好几种RAG哈，Wiki，graphicRAG还有AgenticRAG : [upload=1][/upload]

jansea沧浪客

Sun Jun 7 23:03:31 2026 · #21

我就是让AI增加这些RAG，然后他就写出来了，都是python代码，没有任何sdk 并且有个文件负责识别管理调用这些rag

【在 mengjialou 的大作中提到: 】 : 不用olloma了，改用lmstudio支持我的AMD显卡，没有显卡就是很慢，你说的这些rag是别人集成好了你直接用还是也需要你找工具一点点组成rag

mengjialou孟家楼村的

Sun Jun 7 23:05:11 2026 · #22

莫不是你给ai输入rag，依据ai建议你挨个下载，让ai写py脚本调用的？

【在 jansea 的大作中提到: 】 : 我就是让AI增加这些RAG，然后他就写出来了，都是python代码，没有任何sdk : 并且有个文件负责识别管理调用这些rag

jansea沧浪客

Sun Jun 7 23:16:25 2026 · #23

你是说requirements吧，我看了里边都是基础库，没有任何rag相关的 fastapi==0.104.1 uvicorn==0.24.0 langchain==0.2.0 langchain-community==0.2.0 langchain-ollama==0.1.0 chromadb==0.4.22 pypdf==3.17.4 pdf2image==1.17.0 python-docx==1.1.0 openpyxl==3.1.2 python-multipart==0.0.6 pydantic==2.7.4 pydantic-settings==2.1.0 sentence-transformers==2.2.2 tiktoken==0.5.2 aiofiles==23.2.1 python-dotenv==1.0.0 networkx==3.2.1 watchdog==3.0.0 httpx==0.25.2

【在 mengjialou 的大作中提到: 】 : 莫不是你给ai输入rag，依据ai建议你挨个下载，让ai写py脚本调用的？

mengjialou孟家楼村的

Sun Jun 7 23:18:34 2026 · #24

你这些库我搭rag时候也需要，估计是协议类工具

【在 jansea 的大作中提到: 】 : 你是说requirements吧，我看了里边都是基础库，没有任何rag相关的 : fastapi==0.104.1 : uvicorn==0.24.0

JangGunJangGun

Mon Jun 8 01:44:50 2026 · #25

谷歌Gemma4不是16g就能跑了吗？

【在 mengjialou 的大作中提到: 】 : 己构建了个人专业知识库，文档库变向量库，然后粗筛工具，精排工具，到这就可以不联网使用了，如果觉得精排输出太生硬，可以再连个最便宜的llm，把精排结果给llm,组织一下语言，再输出给你，以上过程需要写一个Python脚本，这个Python脚本你就当个agent用即可，去掉llm你不用花一毛钱，只是需要你把你们行业的电子书都搞到手. : btw,这种模型库不知道是不是可以构建个人性格库，推演对手遇到某种情况会做什么决策 : 附件(122.6KB) 新建_BMP_图像.bmp

mengjialou孟家楼村的

Mon Jun 8 07:34:21 2026 · #26

你说的是本地llm，我说的是rag，不是一个东西

【在 JangGun 的大作中提到: 】 : 谷歌Gemma4不是16g就能跑了吗？

wenxyz34wen

Mon Jun 8 07:38:53 2026 · #27

有没有教程？

【在 mengjialou 的大作中提到: 】 : 己构建了个人专业知识库，文档库变向量库，然后粗筛工具，精排工具，到这就可以不联网使用了，如果觉得精排输出太生硬，可以再连个最便宜的llm，把精排结果给llm,组织一下语言，再输出给你，以上过程需要写一个Python脚本，这个Python脚本你就当个agent用即可，去掉llm你不用花一毛钱，只是需要你把你们行业的电子书都搞到手. : btw,这种模型库不知道是不是可以构建个人性格库，推演对手遇到某种情况会做什么决策 : 附件(122.6KB) -- : FROM 220.196.194.* [上海联通]

shrine08shrine

Mon Jun 8 07:41:47 2026 · #28

关键自己搭建的有没有买token的聪明？

menglongwang朦胧骑士

Mon Jun 8 07:49:36 2026 · #29

没听说过什么叫保密呀

【在 shrine08 的大作中提到: 】 : 关键自己搭建的有没有买token的聪明？

mengjialou孟家楼村的

Mon Jun 8 08:13:30 2026 · #30

没有，根本不是一个量级，glm5.1听说是744B不知道得多少G，自己也买不起能跑glm5.1这种的专业显卡，自己搭最合理的就是搭建rag，rag末端连买token的llm，主要是构建个人知识库，或者很多公司不想让自己公司特有知识流传到外网，向量库加密

【在 shrine08 的大作中提到: 】 : 关键自己搭建的有没有买token的聪明？

shrine08shrine

Mon Jun 8 08:19:40 2026 · #31

我去年试过，搭建自己知识库，连塞进知识库的文章都找不到，不知道是我的搭建问题还是它的智力问题保密方面，codex， claude code让ai在本地知识库操作，还是多少能解决点问题，当然，密级太高也没办法

【在 mengjialou 的大作中提到: 】 : 没有，根本不是一个量级，glm5.1听说是744B不知道得多少G，自己也买不起能跑glm5.1这种的专业显卡，自己搭最合理的就是搭建rag，rag末端连买token的llm，主要是构建个人知识库，或者很多公司不想让自己公司特有知识流传到外网，向量库加密

mengjialou孟家楼村的

Mon Jun 8 08:22:46 2026 · #32

听你描述大概率是你的问题，本地embed给了Python接口，指定知识库路径，写Python调用embed的接口就可以把PDF或者word文件变为向量库了

【在 shrine08 的大作中提到: 】 : 我去年试过，搭建自己知识库，连塞进知识库的文章都找不到，不知道是我的搭建问题还是它的智力问题 : 保密方面，codex， claude code让ai在本地知识库操作，还是多少能解决点问题，当然，密级太高也没办法

shrine08shrine

Mon Jun 8 09:04:08 2026 · #33

应该不是，如果一个文件认不出来我也会觉得是我的问题

【在 mengjialou 的大作中提到: 】 : 听你描述大概率是你的问题，本地embed给了Python接口，指定知识库路径，写Python调用embed的接口就可以把PDF或者word文件变为向量库了