AI
刷新
大模型微调评测入门:看懂这些指标,才知道模型好不好

博主头像 大模型微调评测入门:看懂这些指标,才知道模型好不好 从“瞎评”到“精准评”:大模型微调核心评测指标全拆解 大家好,我是七七!最近后台收到很多粉丝的共性提问:“我用LoRA微调了Llama 2 7B模型做情感分析,怎么判断它好不好用?”“微调后的文案生成模型,凭感觉比原版好,但是怎么证明?” 这其实戳 ...

民用卡 vs 专业卡 vs 云 GPU:大模型微调该选哪种?

博主头像 大模型微调的GPU选型,核心是“匹配场景+平衡成本”——个人追求性价比,团队兼顾稳定性,企业看重规模化。今天这篇文章,我就从三类GPU的核心差异、适配场景、实操选型三个维度,用大白话讲透选择逻辑,附实测数据和选型步骤,帮你不管是个人入门还是企业落地,都能选到最适合的GPU。 ...

大模型成本刺客退散!1/3算力跑出同等效果的秘诀

博主头像 不管是16G显卡的个人开发者,还是预算有限的小团队、追求ROI的企业,算力成本控制都是大模型落地的核心必修课。今天这篇文章,我就从微调、推理两个核心环节,拆解成本控制的底层逻辑和实操技巧,附16G显卡可直接套用的代码,帮你在不牺牲效果的前提下,把算力成本砍到最低。 ...

我们为什么需要另一个“桌面助手”?

一、起点:从手动查找到一键问答 开发初期,我只是想解决自己的一个高频痛点:在写代码、看PDF、甚至答题时,经常需要复制一段文本 → 打开浏览器 → 打开AI对话页 → 粘贴 → 等待回复 → 再切回原窗口。这个过程重复、低效,且打断心流。 于是,第一个版本诞生了:一个简单的窗口程序,内置大模型调用, ...

读人本智能产品设计6原则06互动(上)

博主头像 1. 互动 1.1. 亲密无间且直觉化的交互体验从此成为衡量人机互动的黄金准则 1.2. 对于产品发明者来说,理解人与产品之间只能通过预先编程好的零散规则进行交流互动,这很重要 1.3. 作为消费者和设计师,我们成长的环境都让人理所当然地认为产品就是功能的集合 1.4. 在设计产品的过程中最好是放弃 ...

初学者掌握 claude code 的一些进阶知识

博主头像 目录1.发展史2.斜杠命令 commands3.skill 技能包4.钩子 HOOK5. MCP 服务器6.插件 plugins7.子代理 SubAgents8.项目记忆文件 CLAUDE.md9.Plan模式暂时的结语 很少有人真的喜欢天天学新东西,我一个 java 技术栈的朋友,说我们怎么天天能 ...

基于深度学习的PCB板元器件检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 本文介绍了一个基于YOLO算法的PCB板元器件检测系统,该系统可识别22种元器件,支持图片、视频、批量文件和摄像头实时检测。系统采用Python3.10开发,前端使用PyQt5,数据库为SQLite,集成了YOLOv5/v8/v11/v12等多种模型。通过对比测试显示,YOLO12n模型精度最高(m... ...

Agent设计模式学习(基于langchain4j实现)(7) - 监督者模式

博主头像 书接上回,这次学习一种更高级的模式:监督者模式。职场上的牛马们,大家回想一下,每次部门的OKR,是怎样层层拆解最终落地的?是不是得有一个大佬(即:监督者),根据OKR先做拆解计划(plan),然后把活儿派给各组去落地(action),中间还会时不时的review? 这个就叫做监督者模式。 仍然还是这 ...

读人本智能产品设计6原则05表达(下)

博主头像 1. 物体的表达方式 1.1. 随着产品变得更具有互动性和内容驱动性,例如亚马逊的Alexa或苹果的Siri,语音交互成为多模态系统的必要组成部分 1.2. 语音要素必须与灯光、非语音提示、动作等实体表达形式有机融合,构成统一的产品语义体系 2. 灯光 2.1. 一种可以改变产品整体外观的动态材料 ...

大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解

博主头像 大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解 指令微调破局,让大模型从 “瞎聊” 变 “能干” 大家好,我是七七!刚入门大模型时,我总被一个问题困扰:明明Llama 2、Qwen这些模型能聊天说地,可一让它干具体活就掉链子——让它写电商文案,通篇空话套话;让它整理会议纪要,逻辑混乱漏重点;让它 ...

软件工程Agent在工程依赖版本升级探索

博主头像 背景与动机 现代软件项目广泛依赖开源库以避免重复开发,但库版本更新常引入破坏性变更,导致代码兼容性问题。手动适配这些更新需消耗大量开发者时间,且大型代码库中开发者易忽视更新警告或锁定旧版本,长期阻碍功能迭代、性能优化与安全修复。现有自动化方案未被广泛采用,而 LLM 在代码生成、程序修复等领域已展现 ...

新手在国内,如何 10 分钟快速用上 Claude Code !

博主头像 目录1.首先是安装!2.配置代理3.上聚合站搞 API4.配置环境,自定义模型 API5.选择其他模型6.终于看到主界面了7.完成 首先,这个话题针对的大概率是 claude opus 4.5 模型 很难在国内被使用。这个很好解决,我肯定不会肉身在国内,冒险去花个几百块砸去 Anthropic 官网 ...

基于深度学习的昆虫识别系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 基于YOLO系列深度学习算法的昆虫识别系统,支持对33种昆虫(如星天牛属、剑尾蛾、橙粉蝶等)进行高精度识别。系统提供图片、视频、文件夹批量及摄像头实时检测功能,具备多模型切换、置信度调节、语音播报、结果保存与导出等交互模块。训练阶段采用6000张标注图片,YOLO12n模型在验证集上mAP达40.6... ...

告别盲目试错!大模型微调核心参数的“油门、档位与里程

博主头像 告别盲目试错!大模型微调核心参数的“油门、档位与里程 (一)引言:参数没调对,微调全白费 大家好,我是七七!刚入门大模型微调时,我踩过最致命的坑就是“瞎调参数”——拿着7B模型,随便设个学习率、batch_size就跑训练,结果要么模型不收敛(损失一动不动),要么显存直接炸了,折腾两三天都没调出正经 ...

Agent设计模式学习(基于langchain4j实现)(4) - 并行工作流

博主头像 书接上回,现在简历已经润色得足够好了,投递到了HR手上,假设跟候选人也做了初步的电话沟通。接下来,公司需要对候选人做如下审查: 经理:针对简历,结合招聘岗位要求,审查简历是否符合要求(包括优点和不足) HR:针对简历,结合电话沟通记录以及HR招聘相关要求,审查简历是否适合(包括优点和不足) 团队成员 ...

读人本智能产品设计6原则04表达(上)

博主头像 1. 默契的力量 1.1. 智能产品可以用许多非语言的方式来表达自己 1.2. 就像我们能从宠物身上读到微妙的线索一样,我们也能从智能产品身上读到信息和情感,感知对话的细微差别,并在积极互动时感受到物体是“有生命的”​ 1.3. 生命体的自然流露 1.4. 随着产品承载的信息日益复杂,人们倾向于用语 ...

<1234···50>