AI
刷新
基于深度学习的苹果检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 本文介绍了一套基于YOLO系列算法的苹果检测系统,该系统支持图片、视频和实时摄像头检测,具备多模型切换、结果可视化与统计等功能。系统采用Python3.10开发,前端使用PyQt5,数据库为SQLite,支持YOLOv5/v8/v11/v12等多种模型。实验表明,YOLO12n模型精度最高(mAP4... ...

客服大模型 ≠ 问答机器人

博主头像 为什么很多客服大模型,看起来很聪明,却一点也不好用 如果你做过客服相关的项目,大概率会经历一个非常相似的过程。 一开始,大家都很兴奋。 把历史客服文档、FAQ、知识库一股脑丢进 RAG,接上一个看起来很强的模型,测试时效果还不错。大多数常见问题都能答上来,语气也挺自然,看起来“已经能替代人工了”。 ...

你以为 PPO 很高级,其实它更像个“微调旋钮”

博主头像 为什么 PPO 在真实业务里越来越重要 如果你是从论文或者课程里接触 PPO 的,那大概率会有一种“这东西看起来很厉害”的感觉。策略梯度、clip、KL 约束、reward model,一整套体系下来,很容易让人产生错觉:只要把 PPO 跑起来,大模型就能被“精细打磨”。 但真正进到业务里,你会发现 ...

读人本智能产品设计6原则09链接(上)

博主头像 1. 链接 1.1. 进行智能社交需要具有高强度的认知能力,需要产品花费时间,并具备一定的计算能力才能完成 1.2. 体重秤、追踪器、计步器和整个健身行业的“健身”设备在内的现有设备在这方面都已经做得足够好了 1.2.1. 变化的原因是现在所有的设备都可以相互连接 1.3. Noom服务 1.3.1 ...

基于深度学习的密集人群行人检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 摘要:本文介绍了一套基于YOLO系列算法的密集人群行人检测系统。系统支持图片、视频及实时摄像头检测,具备模型切换、置信度调节、数据统计与导出等功能。通过对比YOLOv5/v8/v11/v12模型性能,显示YOLO12n精度最高(mAP40.6%),YOLO11n速度最快(56.1ms)。系统采用Py... ...

向量数据库技术内核:从存储到检索,拆解其高效运作的秘密

博主头像 向量数据库技术内核:从存储到检索,拆解其高效运作的秘密 写在前面:我也是“被向量数据库名词轰炸”过的人 说实话,我第一次接触向量数据库的时候,是有点抗拒的。 那会儿各种文章都在说: 向量数据库是 AI 时代的“新型基础设施” 没有向量数据库,大模型就跑不起来 它彻底改变了传统数据库的范式 结果我真正 ...

从零开始:PPO 微调大模型实战(基于 PyTorch)

博主头像 从零开始:PPO 微调大模型实战(基于 PyTorch) PPO 真正难的,不是算法本身 如果你已经看过一些 PPO 的原理文章,大概率会有过这种感觉: 好像每个字都认识,但真让我自己写代码,脑子还是一片空白。 这其实挺正常的。 至少我第一次准备动手写 PPO 的时候,也是这种状态。 问题不在你,而 ...

模型推理框架——vllm原理及整体框架

博主头像 Page Attention是优化KV-cache内存管理的方法,可解决预留浪费、内部及外部内存碎片化问题,通过将KV-cache划分为固定大小Block,利用Block Table维护逻辑与物理映射,有效管理非连续内存;同时处理Softmax计算中的数值溢出与全局信息问题。vllm框架支持离线与在... ...

读人本智能产品设计6原则08情境

博主头像 1. 情境 1.1. 设计团队不仅要考虑设计的方方面面,还要考虑智能产品所处的社交环境如何影响关键的设计决策 1.2. 从技术上讲,这个最终被命名为莫克西的机器人在走廊上漫步的时候正在处理各种关键任务,而在这些时刻发生的社交互动将对它的感知产生巨大影响 1.2.1. 可以帮助机器人建立对信任、智能和 ...

吴恩达深度学习课程五:自然语言处理 第二周:词嵌入(三)Word2Vec

博主头像 此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第五课的第二周内容,2.6的内容 ...

20 个神级 AI 编程扩展,爽爆了!

博主头像 大家好,我是程序员鱼皮。给大家分享一些我自己在用的 AI 编程扩展,帮你大幅提高 AI 编程效率和代码质量。 万字长文 + 100 多张图,绝对干货!点个收藏,让我们开始吧~ 本文已收录到 鱼皮 AI 导航的《免费 Vibe Coding 教程》 中,可以在这里免费获取更多 AI 资源。 一、MCP ...

10 万文档 RAG 落地实战:从 Demo 到生产,我踩过的所有坑

博主头像 但当你真的把 RAG 从 Demo 推到生产,会发现三个问题几乎一定会出现: 文档一多,检索明显变慢 明明文档里有答案,模型却“搜不到” 本地 + 向量库 + 模型 + 服务,部署复杂度飙升 这篇文章不会再重复“RAG 是什么”这种内容,而是围绕一个真实企业级目标展开: 在 10 万级文档规模下... ...

读人本智能产品设计6原则07互动(下)

博主头像 1. 零用户界面 1.1. 最强大的系统是利用组合传感技术来进行流畅且可响应的社交互动,这更像是一种全面性体验,更接近人们在现实中与他人互动的方式 1.2. 自动驾驶汽车的应用就不仅仅依赖于一种类型的传感器,而是将雷达、激光雷达、视觉摄像头和物理传感技术全都结合起来,以此来了解车上驾驶员的意图,以及 ...

基于深度学习的交通标志检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 本文介绍了一套基于YOLO系列算法的交通标志检测系统。该系统采用深度学习技术,支持55种常见交通标志的识别,具备图片、视频、批量文件及实时摄像头检测功能。系统提供图形化界面,包含模型切换、参数调节、结果统计与语音播报等实用功能,并配套用户管理、脚本调用和模型训练流程。技术栈采用Python3.10+... ...

吴恩达深度学习课程五:自然语言处理 第二周:词嵌入(二)词嵌入模型原理

博主头像 此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第五课的第二周内容,2.4到2. ...

使用 AI 编程工具的一点实践体会:为什么要减少对话轮次、一次把需求说清楚

博主头像 在使用 Cursor、ChatGPT 等 AI 编程工具的过程中,我逐渐意识到: 相比多轮对话不断修补需求,用更少的对话轮次一次性描述清楚核心需求, 反而更容易得到符合预期的实现。 本文结合实际使用经验,分析了对话轮次过多导致结果偏离的原因, 以及在什么情况下应当重新编辑问题而不是继续对话修补。 ...

WebDataset使用指南:构建高效深度学习数据管道

博主头像 在深度学习项目实践中,数据加载往往成为限制训练速度的关键瓶颈。当数据集规模达到数百万甚至数十亿样本时,传统的文件系统随机访问方式会导致I/O效率急剧下降,让昂贵的GPU资源处于闲置等待状态。WebDataset通过流式处理和顺序读取的设计理念,可以极大提升数据加载性能。 什么是WebDataset? ...

<123···50>