LangChain4j 开发Java Agent智能体- 阿里云百炼大模型平台接入以及Ollama简介以及安装和使用
大家好,我是Java1234_小锋老师,最近更新《2027版本 LangChain4j 开发Java Agent智能体 视频教程》专辑,感谢大家支持。
本课程主要介绍和讲解 LangChain4j 简介,阿里云百炼大模型平台接入,Ollama简介以及安装和使用,HelloWorld 实现,日志配置,集成SpringBoot,Ai Service 使用,对话与提示词工程(Prompt),结构化输出,会话记忆,工具调用(Function Calling),嵌入模型与向量数据库,RAG(检索增强生成),MCP(模型上下文协议),多模态支持
视频教程+课件+源码打包下载:
链接:https://pan.baidu.com/s/1o-zRfndo1HHrS_uFroOiCw?pwd=1234
提取码:0000
LangChain4j 开发Java Agent智能体- 阿里云百炼大模型平台接入以及Ollama简介以及安装和使用
阿里云百炼大模型平台接入
阿里云百炼平台简介
阿里云百炼平台是阿里云推出的一站式大模型开发与应用平台。它的核心目标是为企业和开发者提供从模型选择、训练调优到应用部署的全链路服务,降低AI应用的开发门槛和周期。
阿里云百炼平台官方
具体来说,它具备以下核心能力和特点:
丰富的模型选择:平台集成了包括阿里通义系列在内的上百款国内外主流大模型,覆盖文本生成、多模态理解等多种场景。用户可以根据业务需求灵活选择。
一站式模型定制:支持用户利用自己的数据,通过可视化界面进行模型的微调(SFT)、评估和部署,让模型更贴合特定业务场景。
便捷的应用构建:提供低代码的开发环境,通过简单的流程编排和知识库集成,可以快速搭建如智能客服、AI助手等应用。它支持检索增强生成技术,让模型能结合企业私有知识进行回答。
开放的生态与工具:首批上线了50多款主流的MCP服务(如高德、Notion等),让大模型能轻松连接和使用外部工具,实现更复杂的任务,比如构建一个能自动规划行程的智能体。
灵活的成本与安全:采用按量付费模式,新用户通常有免费额度。同时,平台承诺不会将用户数据用于模型训练,并采用多重加密保障数据安全。
阿里云百炼大模型平台注册以及创建API key
打开阿里云百炼平台官方
我们用支付宝快捷登录。
官方默认给我们一些主流模型的试用100万 token额度,学习足够了,我们点“模型服务” -> "工作台" -> 模型用量",这里有个非常重要的注意点,大家一定要开启下“免费额度用完即停”。
接下来,我们要使用阿里云百炼平台接口的话,需要先创建API Key。
我们点“模型服务” -> "秘钥服务" ,点击“创建API Key”
弹出“创建API Key”窗体,选择归属账号,然后点“确定”即可
这样的话,我们就创建好了API Key
环境变量里面,我们要把API KEY配置上去,后面我们讲项目需要用到:
环境变量名:OPENAI_API_KEY
Ollama简介以及安装和使用
前面我们用阿里云百炼平台,是很方便,快捷,有免费额度,但是仅仅是部分模型有免费额度,而且额度也是有限制的。所以我们还有一种本地方案 - 使用Ollama部署蒸馏模型。
Ollama简介
Ollama官网
Ollama 是一个开源的本地大语言模型运行工具,它让用户能够轻松地在自己的电脑上部署和使用各种大型语言模型,无需联网也不需要昂贵的云服务。
核心特点
1. 简单易用
一键安装,命令行操作
几条命令就能下载和运行模型
类似 Docker 的使用体验
2. 本地运行
数据完全本地保存,保护隐私
无需联网,随时随地可用
没有 API 调用限制和费用
3. 模型支持
支持 Llama 3、Phi 3、Mistral、Gemma 等主流开源模型
可通过 Modelfile 自定义模型
支持 GGUF 格式的模型导入
适用场景
开发者本地测试和开发
隐私敏感的数据处理
离线环境使用
学习和研究大模型
Ollama 极大地降低了普通人使用大语言模型的门槛,让任何人都能方便地在自己的电脑上体验先进的 AI 技术。
Ollama蒸馏模型介绍
蒸馏模型(Distilled Model)是通过知识蒸馏技术压缩后的小型模型,Ollama 支持运行这类轻量化模型,让普通电脑也能流畅运行 AI。
什么是知识蒸馏?
知识蒸馏就像一个师生学习过程:
教师模型:大型模型(如 700 亿参数的 Llama),知识丰富但运行慢
学生模型:小型模型(如 70 亿参数),学习模仿教师模型的输出
结果:学生模型体积小、速度快,同时保持接近教师模型的性能
Ollama 支持的蒸馏模型
1. Llama 3.2 系列(Meta)
1B 和 3B 参数版本
适合移动设备和低配置电脑
保持较好的对话能力
2. Phi-3 系列(微软)
Mini(3.8B)、Small(7B)版本
微软精心挑选训练数据
小尺寸但推理能力强
3. Gemma 系列(Google)
2B 和 7B 参数
基于 Gemini 技术蒸馏而来
开源免费商用
4. Qwen 系列(阿里)
0.5B、1.8B、4B、7B 版本
中英文能力均衡
适合中文场景
蒸馏模型在 Ollama 中的优势
性能对比(以 Llama 3 为例):
| 模型 | 参数 | 内存需求 | 速度 | 适用设备 |
|---|---|---|---|---|
| 原版 | 70B | >140GB | 慢 | 服务器 |
| 蒸馏版 | 8B | ~16GB | 快 | 个人电脑 |
| 蒸馏版 | 3B | ~6GB | 极快 | 笔记本/RPi |
实际好处:
普通电脑(8-16GB 内存)也能运行
生成速度快 3-10 倍
功耗低,适合长时间运行
硬盘空间占用小
Ollama下载安装
ollama下载地址:
https://ollama.com/点击 下载即可。
下载到本地后,我们双击安装:
出现下面这个界面,就说明安装好了
默认界面还是很简约的,提供了聊天对话框,以及右侧可以选择模型,我们可以搜索然后下载需要的模型
这里面每个模型后面都有多少b,比如4b,这个b就是10亿参数,4b就是40亿参数,我们根据当前机器的显卡显存大小来选择具体的参数模型,比如你电脑就4个G的显存,那就选个4b,如果是高配32G显存,那基本都能跑。
比如我们选择一个4b(40亿参数)的qwen模型,去提问“你是谁?”,那么Ollama先会自动下载模型,然后回答问题。
下载完后,就自动回答你的问题。
