langchain 快速入门(四):搭建强大的AI Agent
简介 AI Agent 不仅仅是一个能聊天的机器人(如普通的 ChatGPT),而是一个能够感知环境、进行推理、自主决策并调用工具来完成特定任务的智能系统,更够完成更为复杂的AI场景需求。 AI Agent 功能 根据查阅的资料,agent的功能点如下: Agent = LLM + 规划 + 记忆 ...
读人本智能产品设计6原则12整合(下)
1. 模拟同理心 1.1. 可以利用人工智能的多种维度来理解人们在界面设置上的偏好 1.2. 能基于对社交媒体用户数据的分析构建个人预测画像,从而推断在特定时刻何种产品行为最为适宜 1.3. 当产品被赋予实时主动分析与理解用户情绪状态的能力时,便形成了一种机器驱动的模拟共情 1.4. 情感计算 1. ...
微软开源 VibeVoice:90 分钟播客级语音合成技术解析
一个改变语音合成的技术突破 你有没有想过,输入一段对话脚本,AI 就能生成两个人自然交谈 90 分钟的播客音频——不是机械的电子音,而是有停顿、有情感、能互动的真实对话。 微软刚开源的 VibeVoice 做到了。 它解决了什么实际问题 传统文本转语音工具存在三个明显短板: 长度受限 市面上的语音合 ...
数据集不是“越多越好”:微调里最容易被误解的一件事
微调中数据非“越多越好”,而是“越清楚越好”。它本质是约束而非燃料:重目标一致性、表达稳定性与边界清晰度,而非规模。小而精的数据更易定位问题、验证假设;盲目扩量反致模型平均化、难调试、掩盖目标缺陷。关键在明确“教模型什么”,而非堆砌数量。 ...
基于深度学习的农业日常害虫检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
本文介绍了一套基于YOLO算法的农业害虫检测系统。该系统支持图片、视频、摄像头等多模态检测,提供多模型切换(YOLOv5/v8/v11/v12)、结果可视化、统计分析等功能。技术栈采用Python3.10+PyQt5+SQLite,模型训练脚本支持自动路径修正和批量训练。性能测试显示YOLO12n精... ...
微调显存总爆炸?问题往往不在你以为的地方
大模型微调常遇“显存不够”,但根源常被误判:显存主要消耗在激活值(activation)、优化器状态(如Adam×3)和梯度上,而非模型参数本身。bf16仅减存储不减数量,checkpointing、梯度累积等是有效优化手段。显存问题本质是系统认知问题,而非硬件不足。 ...
langchain 快速入门(三):搭建RAG知识库
简介 LLM大模型一般训练的数据都是滞后的,这是就需要用到RAG知识库,RAG知识库可以降低大模型在输出答案时的幻觉,也能够让大模型知识拓展。 知识库架构知识 检索流程图 用户输入 (User Query) | v + + | 提示词 (Prompt) | + + | | (1) 转化为向量 (Em ...
评估,才是微调里最反直觉的部分
微调跑通≠成功!训练是确定性工程,评估才是核心认知挑战:loss不反映真实效果,人工评估难但不可替代。关键在明确定义“何为更好”,用固定对照集+对比输出持续校准目标,让评估成为理解模型行为的迭代过程。 ...
读人本智能产品设计6原则11整合(上)
1. 整合 1.1. 设计一件聪明的社交智能产品,其方法是要承认界面的局限性,而不是急于尝试复制人类可能做的事情 1.2. Phonekerchief 1.2.1. 一款用银纤维制成的手帕,可用来屏蔽手机来电和短信 1.2.2. 使用Phonekerchief手帕可以用一种可见的方式提供更加明确的社 ...
吴恩达深度学习课程五:自然语言处理 第二周:词嵌入(五)GloVe 算法
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第五课的第二周内容,2.8的内容 ...
钉钉A1与飞书AI录音豆
钉钉A1与飞书AI录音豆的全面对比分析表。从整体定位来看,两款产品分别深度绑定各自办公生态,面向职场会议场景,但在设计理念和功能侧重上有明显差异:核心差异总结对比维度钉钉A1飞书AI录音豆设计哲学性能优先:强调专业级录音质量和大容量存储便携优先:极致轻薄,无感佩戴,快速响应拾音能力6麦阵列+骨传导, ...
基于深度学习的交通锥形桶检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
摘要:本文介绍了一个基于YOLO系列算法的交通锥形桶检测系统,该系统针对传统道路安全设施检测的痛点问题,实现了多模态检测、模型切换和结果可视化等功能。系统采用PyQt5前端界面和SQLite数据库,支持图片、视频及摄像头实时检测,并具有语音播报、结果导出等实用特性。通过对比YOLOv5/YOLOv8... ...
为什么 loss 几乎没用:微调里最容易让人“自嗨”的指标
loss 在微调里不是没用,而是作用范围被严重高估了。它能告诉你“训练有没有在跑”,却几乎无法告诉你“模型有没有变成你想要的样子”。如果你把 loss 当成主要决策依据,那你很可能会在一条看起来很平滑的曲线上,慢慢把模型带偏。真正成熟的微调过程,永远是:loss 作为底线保障,输出评估作为核心依据 ...
Vibe Coding 小记 —— Google AI Studio
最近发现了一个 token 免费的 Vibe Coding 工具 —— Google AI Studio,还支持一键把项目上传到 github,在这里推荐给大家! ...
langchain 快速入门(二): chain链的应用
简介 langchain中提供的chain链组件,能够帮助我门快速的实现各个组件的流水线式的调用,和模型的问答 Chain链的组成 根据查阅的资料,langchain的chain链结构如下: $$Input \rightarrow Prompt \rightarrow Model \rightarr ...
从 0 到跑通一次微调:别急着追效果,先让它“真的动起来”
微调最难的不是算法,而是“跑通全流程”。首次微调应聚焦简单目标:让模型回答更规范、语气更一致。避免复杂数据与环境折腾。loss下降不等于成功,关键看输出是否按预期改变。跑通一次,复盘流程,才是真正入门。 ...
读人本智能产品设计6原则10链接(下)
1. 可穿戴设备 1.1. 可穿戴设备 1.1.1. 联产品开发中最引人注意的领域之一就是身体互联产品 1.2. 随着纺织和印刷技术的进步,制造商可以将电子元件直接嵌入服装中,从而为用户提供可持续跟踪的数据 1.3. 这个生态系统基本上可以让用户与其身体进行持续的对话,从而创建一个反馈循环,让人们更 ...
Langchain 快速入门(一)
简介 langchain专门用于构建LLM大语言模型,其中提供了大量的prompt模板,和组件,通过chain(链)的方式将流程连接起来,操作简单,开发便捷。 环境配置 安装langchain框架 pip install langchain langchain-community 其中langcha ...
吴恩达深度学习课程五:自然语言处理 第二周:词嵌入(四)分层 softmax 和负采样
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第五课的第二周内容,2.7的内容 ...
基于深度学习的苹果检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
本文介绍了一套基于YOLO系列算法的苹果检测系统,该系统支持图片、视频和实时摄像头检测,具备多模型切换、结果可视化与统计等功能。系统采用Python3.10开发,前端使用PyQt5,数据库为SQLite,支持YOLOv5/v8/v11/v12等多种模型。实验表明,YOLO12n模型精度最高(mAP4... ...


