我的学习笔记

DeepSeek火爆现象背后企业可以得到什么实质提升？

Thu, 13 Feb 2025 09:49:25 GMT

DeepSeek火爆现象背后企业可以得到什么实质提升？

本文的主要内容：

DeepSeek火爆最值得关注的点；

企业可以在DeepSeek进化中得到哪些好处；

企业如何更近一步拥抱AI。

DeepSeek-R1（其实还有V3）这个春节真的太火爆了，感觉比上一个春节期间的Sora带来的轰动要更加强烈，而且在最终效果上也非常落地和成功，媒体热度和DeepSeek的服务器一样，近20天了依然热得发烫。但我们也不能只看个热闹，还是想分析一下企业AI应用市场可以在火爆现象背后得到那些实质提升。

RAG的2024—随需而变，从狂热到理性

Thu, 14 Nov 2024 01:51:41 GMT

转眼到了2024年尾，和小伙伴一起创立TorchV也接近一年。虽然这一年做了很多事情，但从技术层面上来说，RAG肯定是不得不提的，所以今天分享一下作为大模型应用创业者所感知的这一年，RAG技术和市场环境的变化。

首先申明，本文更多来自于本人主观感受，且内容更多是回顾性的结论，不建议作为其他文章的引用材料。

主要内容包括：

RAG技术变化

主要架构变化

技术细节变化

市场需求变化

上半年：AI无所不能，大而全；

下半年：回归理性，小而难；

明年预测：应用才是王道；

从业者变化。

其中技术部分放在上篇，市场需求变化放在下篇。

一、RAG技术变化

RAG（检索增强生成）其实是由两部分组成的，分别是检索和大模型生成。当然，既然有检索就必然会先有索引，包括chunking、embedding等动作都是为了建立更好的索引。因为我们之前从零开始创建并运营了一个千万级用户的智能问答类产品，所以在2021年左右其实就已经采用Java技术栈在使用RAG里面“RA”的大部分技术了。在2023年年中，RAG这个词突然火了起来，于是我们就立马就扑进去了，而且相信RAG在企业应用领域比纯粹使用大模型会更具实用性，至少在三年之内是这样的（随着最近传闻Scaling Law遇到瓶颈，好像这个时间还有可能被推后）。短短几个月，RAG开始的火爆程度甚至有超过LLM的趋势，在2024年1月我甚至还参加了“共识粉碎机”的EP15讨论会，主要话题就是“2024年是否会成为RAG元年？”。

【翻译】RRF — 如何在 RAG 中对多种检索方法的结果进行评分

Fri, 08 Nov 2024 02:46:42 GMT

原作者：Deval Shah

原文：Reciprocal Rank Fusion (RRF) explained in 4 mins — How to score results form multiple retrieval methods in RAG

图：RAG 中的倒数秩融合（图片由作者提供）

检索增强生成（RAG）是自然语言处理中的一种强大技术，结合了基于检索的模型和生成模型的优势。
检索阶段可以成就或破坏您的 RAG 管道。
如果检索器未能从检索器中获取相关文档，则精度较低，幻觉的可能性会增加。

有些查询适合基于关键字的检索技术，如 BM25，而有些查询在密集检索方法中可能表现得更好，其中我们从语言模型嵌入了 embedding。有混合技术可以解决这两种检索方法的缺点。

在这篇博文中，我们将深入探讨 RRF、它的机制、数学直觉和在 RAG 系统中的应用。

什么是倒数秩融合？

聊个5分钟的企业AI应用需求变化趋势

Mon, 09 Sep 2024 06:18:54 GMT

好久没打理Blog了，今天抽时间聊聊当下的企业AI应用需求趋势。

一、企业AI应用需求的底层逻辑

如果从去年年底开始算，我们接触的需求也不少了，具体数量肯定在四五百个以上，各类需求都有。如果一定要做个归纳分类，那可以从客户需求的出发点切入来分类，或者说从底层逻辑来分类。

01用新技术解决老问题

介绍TorchV AI的两款应用，做简洁却重要的事情

Thu, 01 Aug 2024 00:50:18 GMT

写在前面

在我的产品研发生涯中，出品的产品已经超过十个了，有 toG、toB也有toC，有复杂的，也有非常简单的。回顾这十多个产品，也发现一个有意思的想象，但凡现在依然还被很多客户在使用的，往往都是目的很纯粹的产品，至少从产品初衷来说，都是仅为了解决一个核心问题的。而那些单个产品就带有很多功能的toG系统，现在基本上都已经被扔进垃圾桶了……

所以在我和八一菜刀自己出来创业之后，就“立志”要做简单但强大的产品。

简单：也就是上面说的产品的初衷非常单纯，就是去解决一个问题；
强大：这可能有多个解释，如对客户非常有效，有很高的使用价值；产品使用体验非常好，上手很快，能被广泛使用；产品性能好，性能稳定，可解释性（可控）强。

稀土掘金分享——RAG在企业应用中落地的难点与创新（文字稿）

Thu, 04 Jul 2024 05:41:24 GMT

0629讲稿

以下是我在2024年6月29日上午在北京富力万丽酒店举行的稀土掘金开发者大会RAG专场的分享内容，包括文字稿，一并分享给大家！

朋友们，上午好！

我叫卢向东，来自杭州，今天为大家分享的是我们在大模型应用的企业落地时碰到的一些关于RAG的难点和创新。

可能很多朋友认识我是因为公众号“土猛的员外”，从去年6、7月份开始持续分享了关于RAG和大模型的一些文章和观点。现正在和几个伙伴一起创业，担任杭州萌嘉网络科技（也就是TorchV）的CEO。

今天在这里想和大家分享的主要内容，是关于我们在大模型应用的企业落地场景中遇到的一些问题，以及一些落地的产品案例。我一共会分享四个难点，三个应用案例，然后把一些个人对这一领域的思考放在最后面。希望能从不同视角给大家带来一些大模型应用在企业落地实践中的内容。

OK，那现在我们就进入第一Part，来讲讲我们在实践中遇到的问题。

TorchV AI用户手册0609

Tue, 11 Jun 2024 01:04:46 GMT

title: 用户手册-快速入门
slug: /getting-started
displayed_sidebar: mainSidebar

版本历史

版本	作者	日期	备注
beta v1.0.0	卢向东(yuanwai@mengjia.net)、肖玉民(xiaoymin@mengjia.net)	2024/02/28	初始化
beta v1.6.0	卢向东(yuanwai@mengjia.net)、肖玉民(xiaoymin@mengjia.net)	2024/03/31	正式版本v1.0
beta v1.7.0	卢向东(yuanwai@mengjia.net)、肖玉民(xiaoymin@mengjia.net)、厉杭波(lihangbo@mengjia.net)	2024/04/11	正式版本v1.1
beta v1.7.3	卢向东(yuanwai@mengjia.net)、肖玉民(xiaoymin@mengjia.net)、厉杭波(lihangbo@mengjia.net)	2024/05/07	正式版本v1.2
beta v1.7.5	卢向东(yuanwai@mengjia.net)、肖玉民(xiaoymin@mengjia.net)、厉杭波(lihangbo@mengjia.net)	2024/06/07	正式版本v1.3

1.引言

1.1 编写目的

本手册旨在介绍TorchV AI用户端的业务及操作流程，以便用户能更有效地进行业务处理和操作。

主要内容

1.2 读者对象

使用TorchV AI产品的运营人员及技术人员

1.3 环境要求

浏览器：Chrome 100+/火狐(FireFox)/Microsoft Edge

1.4 产品架构说明

本文不展示具体产品架构，如您需要查看TorchV产品架构，请点击TorchV产品架构查看。

2.快速开始

LLM企业应用落地场景中的问题一览｜LLM ｜RAG ｜Agent ｜TorchV

Sat, 18 May 2024 04:59:07 GMT

最近两个多月写文章的频率明显低了很多，不是因为懒了，而是忙着做LLM应用的客户场景落地去了。今天把客户场景落地中的一些心得总结分享一下，希望对广大期望LLM应用落地的企业有一些帮助。

前述

与很多企业客户的深度接触之后，发现绝大多数企业在LLM应用落地中存在三个显著问题，这些企业包括世界500强企业、央企、著名品牌公司，也包括和我们一样但非AI行业的创业公司，所以从样本上来说应该有一定的参考下。然后再分享一下我们在落地过程中碰到的各种难点和需要客户一起决策的点。

三个问题

AI思维：就像以前大家常说的“互联网思维”一样，AI思维接下来肯定会被越来越多提及。其实所谓的“XX思维”没这么玄乎，说到点子上，其实就是想了解更多已经在开展的案例，然后结合自身情况来做“复制”或创新；
快速工具：企业工作人员使用LLM很简单，一个浏览器就可以。但是要把LLM的能力结合到自身的业务应用和系统中就没那么容易。需要对接LLM的API、控制幻觉、管理知识库、让RAG的准确度、相关性达到企业应用水平，还需要和自己的应用相结合等。绝大多数企业更希望将自有的研发人员（AI研发人员稀缺是普遍现象）投入到应用开发上，希望基于一个开箱即用、稳定和高质量的LLM应用开发平台来提升他们的业务水平；
POC验证：这是大部分企业开始都没有提出来的，但却是最影响签约的环节。企业客户需要一套有说服力的POC评测方案，在评测结果上得到满意效果之后，企业内部决策（购买）才会变得更加顺畅。

【翻译】AI Agents Are All You Need

Sun, 28 Apr 2024 13:34:17 GMT

大语言模型(LLM) 已经存在了几年，它们正在迅速向 AI Agents和Agents Workflow发展。不要误解我的意思，大语言模型(LLM)是很棒的，但他们在自动化方面仍然不够有效。大语言模型与其他工具相结合是利用大语言模型(LLM)所拥有的通用智能的一种非常有效的方式，通过消耗大量的Tokens。大语言模型最大的问题是他们有迷失的倾向(幻觉和自我一致性)，我们永远不知道大语言模型(LLM)或代理(Agents)什么时候会失败。在这些失败的周围几乎没有护栏，但我们还远远没有结束利用大语言模型(LLM)通用智能的全部能力。

因此，在今天的博客中，我们将深入探讨:

大语言模型(LLM)的未来是什么样子;
我们如何从RAG管道转向Agents;
以及创建一个可行的基于LLM的AI Agent(工具使用、Memory和规划)有哪些挑战?;
最后，我们研究不同类型的Agents，以及AI Agents和RAG的未来是什么样子.

探讨实现AI Agents的三种方式，不同的方式带来不同的客群和场景｜LLM ｜Agent ｜RAG

Fri, 26 Apr 2024 03:42:00 GMT

昨天去参加在上海举办的NVIDIA创业者会议，感受了AI创业的热情，还听了Dify CEO张路宇的分享。加上吴恩达在红杉分享会上对AI Agents的推动，带动了国内大量自媒体对AI Agents的狂轰滥炸。所以也想从我自己的角度来分享一些思考。

先贴一下吴恩达分享的四种AI Agents设计模式：

自我反思（Reflection）：可以自我修正；
使用工具（Tool Use）：链接其他系统去做一些事情，比如把我电脑里面的未归档文件做好归档；
规划（Planning）：类似于思维链，分解复杂任务，找到路径；
协作（Multiagent Collaboration）：不同类型的助理（agent），可以通过协作组成一个团队或一家公司，嗯，不过目前这一步应该还需要一些时间。

本质上AI Agents是一个依赖于大语言模型（LLM）的业务组件，是LLM在企业场景落地中的手段，而且不仅一种手段。我觉得目前由三种主流的AI Agents的采用方式，纯个人观点，不代表任何官方意见。

【翻译】DSPY简易教程

Fri, 19 Apr 2024 00:30:30 GMT

目前，使用大型语言模型(LLMs)构建应用程序不仅复杂而且脆弱。典型的pipelines通常使用prompts来实现，这些prompts是通过反复试验手工制作的，因为LLMs对prompts的方式很敏感。因此，当您更改pipelines中的某个部分(例如LLM或数据)时，可能会削弱其性能—除非您调整prompts(或微调步骤)。

当您更改pipeline中的一部分时，例如LLM或数据，您可能会削弱其性能……

DSPy[1]是一个框架，旨在通过优先编程而不是prompt来解决基于语言模型(LM)的应用程序中的脆弱性问题。它允许您在更改组件时重新编译整个管道，以根据您的特定任务对其进行优化，而不是重复手动轮次的prompt工程。

虽然关于该框架的论文[1]早在2023年10月就已经发表了，但我是最近才知道的。在看了Connor Shorten的一个视频“DSPy解释!” 之后，我已经可以理解为什么开发者社区对DSPy如此兴奋了!

本文简要介绍了DSPy框架，涵盖了以下主题:

什么是DSPy(包括关于DSPy vs. LangChain vs. LlamaIndex和DSPy vs. PyTorch的讨论)
DSPy编程模型:签名，模块，和提词器
DSPy编译器
DSPy示例:Naive RAG Pipeline

【翻译】LLM的Function-Call简易教程

Sat, 13 Apr 2024 09:30:14 GMT

Function Call（函数调用）并不是什么新鲜事。2023 年 7 月，OpenAI 为其 GPT 模型引入了函数调用，该功能现在已被竞争对手采用。Google 的 Gemini API 最近支持它，Anthropic 正在将其集成到 Claude 中。函数调用对于大型语言模型（LLMs ）来说变得至关重要，从而增强了它们的功能。

考虑到这一点，我的目标是编写一个全面的教程，涵盖基本介绍之外的函数调用（已经有很多教程了）。重点将放在实际实施上，构建一个完全自主的人工智能代理，并将其与 Streamlit 集成，以获得类似 ChatGPT 的界面。虽然 OpenAI 用于演示，但本教程可以很容易地适用于其他LLMs支持函数调用，例如 Gemini。

Function Calling是干什么用的？

Function Calling（函数调用）使开发人员能够描述函数（也称为工具，您可以将其视为模型要执行的操作，例如执行计算或下订单），并让模型智能地选择输出包含参数的 JSON 对象来调用这些函数。简单来说，它允许：

Autonomous decision making（自主决策）:模型可以智能地选择工具来回答问题。
Reliable parsing（可靠的解析）: 响应采用 JSON 格式，而不是更典型的类似对话的响应。乍一看似乎并不多，但这就是允许LLM连接到外部系统的原因，例如通过具有结构化输入的 API。

它开辟了许多可能性：

Autonomous AI assistants（自主人工智能助手）: 机器人可以与内部系统交互，完成客户订单和退货等任务，而不仅仅是提供查询的答案
Personal research assistants（个人研究助理）: 假设您正在计划旅行，助理可以在 Excel 中搜索 Web、抓取内容、比较选项和汇总结果。
IoT voice commands（IoT 语音命令）: 模型可以控制设备或根据检测到的意图建议操作，例如调整交流温度。

Function Calling的结构

【翻译】神经网络背后的数学原理

Wed, 10 Apr 2024 12:00:32 GMT

神经网络是人工智能（AI）的核心，为从发现照片中的物体到翻译语言的各种应用提供动力。在本文中，我们将深入探讨神经网络是什么，它们是如何工作的，以及为什么它们在当今技术驱动的世界中很重要。

Index 指数

·1：了解基础知识
∘ 1.1：什么是神经网络？
∘ 1.2：神经网络的类型
·2：神经网络的架构
∘ 2.1：神经元的结构
∘ 2.2：图层
∘ 2.3：层在学习中的作用
·3：神经网络的数学
∘ 3.1：加权总和
∘ 3.2：激活函数
∘ 3.3：反向传播：神经学习的核心
∘ 3.4：分步示例
∘ 3.5：改进
·4：实现神经网络
∘ 4.1：用 Python 构建简单的神经网络
∘ 4.2：利用库实现神经网络（TensorFlow）
·5：挑战
∘ 5.1：克服过拟合
·6：结论

1：了解基础知识

1.1：什么是神经网络？

神经网络是生物学和计算机科学的酷炫融合，灵感来自我们大脑处理复杂计算任务的设置。从本质上讲，它们是旨在发现模式和理解感官数据的算法，这使它们可以做很多事情，例如识别人脸、理解口语、做出预测和理解自然语言。

TorchV AI v1.0正式更新&新版官网上线

Mon, 01 Apr 2024 11:54:09 GMT

TorchV AI v1.0发布

经过一个忙碌的3月，2024年4月1日，我们迎来了2024年1月26日首次发版以来最大的一次更新，TorchV AI（原TorchV Bot）从原来的beta 版本升级到了正式版v1.0。

目前TorchV AI的主要技术架构依然还是RAG+LLM，实现的是”快思考“的功能。再往后，我们会在TorchV AI中逐步增加”慢思考“的功能，既更加面向业务的Agent和Workflow。

以下是TorchV AI v1.0的主要更新升级内容：

整体检索能力有显著提升：
- Rerank策略重大优化，召回率更大；
- 表格处理能力重大优化，表格内容识别和计算能力增强；
提取解析能力升级：
- Chunking策略优化，针对文件内容疏密程度使用不同chunking方法；
- 搭建OCR服务器，优化含图片类型文件的提取解析能力；
- Word解析bug修复，内部表格提取能力加强；
应用中心全新发布：
- 新增应用中心大板块，用户可创建不同应用，废弃原来APIKey的直连方式；
- 应用内容增加仅限当前应用的参数配置和调试窗（Playground）功能，支持发布调试后的配置；
- 增加”一键嵌入“功能，引入几行js代码，即可在网站上实现AI问答服务。

您依然可以申请TorchV AI的试用，直接加微信（lxdhdgss）联系即可！

聊聊AI应用创业心得，我们在路上|大模型应用落地场景|RAG|SaaS|PaaS|GTM|TorchV

Thu, 21 Mar 2024 05:16:50 GMT

本文非AI技术文章，而是讲述我们在AI应用创业过程中的一些心得。网上常说技术创业者往往缺的不是技术，而是对市场需求的感知，以及如何做到PMF。我们离PMF还有距离，但是已经在路上，所以分享一些自己的AI创业心得，希望得到您共鸣和反馈。

为客户感到开心

昨天最开心的一件事情是我们的一个客户（后面简称“ZY”）的AI应用上线了，ZY使用的是TorchV的AI PaaS服务，而且他们切入的市场需求真的非常棒！鉴于他们做的是专属社群的生意，不太愿意在互联网过多曝光，所以我只说一些大概内容，会略去一些敏感信息。

首先他们的服务对象是在读的重点大学本科生与各类研究生，为学生提供收费的知识服务，对于他们商业模式我就不再过多透露了，但我们内部也评价了一下，确实很有卖点，而且他们具备一些独特优势。

下面我把重点放在讲述ZY与我们TorchV相关的内容上。

挖掘非结构化数据的价值（1）—通过RAG实现与文件对话

Tue, 05 Mar 2024 07:36:29 GMT

注意：本文【非技术文章】，适用于所有想通过最新的AI技术优化自己的工作和业务的朋友。

在大部分企业和事业单位，非结构化数据占比远大于结构化数据，挖掘非结构化数据的价值，为人们所用，任重道远。

连接的价值

王坚博士的《在线》是一本相对有争议的书，当年出版不久，我记得身边的朋友里就有人踩有人捧。虽然他当时讲的更多是基于云计算和大数据的一些未来发展看法，但是其中有一个重要观点，我觉得在AI时代依然适用，那就是“连接”。连接讲的是数据与互联网的连接，是数据与各类业务系统的连接，只有发生了连接，数据的价值才会像石油遇见内燃机，交流电遇见电动机一痒，价值成倍上升。没有连接的数据就只能变成“沉默数据”，在掸去尘灰再次被人发现之前，这些资料文件毫无价值。

【译文】生成式AI设计模式全面指南

Mon, 26 Feb 2024 08:59:57 GMT

为什么需要AI设计模式

我们在构建新事物时，都会依赖一些经过验证的方法、途径和模式。对于软件工程师来说，这个说法非常正确，但对于生成式人工智能和人工智能本身来说，情况可能并非如此。随着生成式人工智能等新兴技术的出现，我们缺乏充分验证的模式来支撑我们的解决方案。

在这里，我分享了一些生成式人工智能的方法和模式，这些方法和模式是基于我对LLM在生产中的无数实现的评估。这些模式的目标是帮助减轻和克服生成式人工智能实现中的一些挑战，如成本、延迟和幻觉。

设计模式列表

【译文】基于Siamese网络的zero-shot意图分类

Sun, 25 Feb 2024 14:34:24 GMT

意图识别是面向目标对话系统的一项重要任务。意图识别(有时也称为意图检测)是使用标签对每个用户话语进行分类的任务，该标签来自预定义的标签集。

分类器在标记数据上进行训练，并学习区分哪个话语属于哪个类别。如果一个看起来不像任何训练话语的话语来到分类器，有时结果会很尴尬。这就是为什么我们也会对“域外”话语进行分类，这些话语根本不属于域。

【译文】开源多语言embedding模型对比大作战

Sun, 25 Feb 2024 08:07:36 GMT

OpenAI最近发布了他们的新一代embedding模型，称为embeddingv3，他们描述是他们性能最好的embedding模型，具有更高的多语言性能。这些模型分为两类:较小的称为text-embeddings-3-small，较大且功能更强大的称为text-embeddings-3-large。

有关这些模型的设计和训练方式的信息披露得很少。正如他们之前发布的embedding模型(2022年12月与ada-002模型类)一样，OpenAI再次选择了一种闭源方法，其中模型只能通过付费API访问。

但这些性能真的值得花钱去看吗?

这篇文章的动机是将这些新模型与开源模型的性能进行实证比较。我们将依赖于一个数据检索工作流，在这个工作流中，必须根据用户查询找到语料库中最相关的文档。

我们的语料库将是欧洲人工智能法案，该法案目前处于验证的最后阶段。这个语料库除了是世界上第一个关于人工智能的法律框架外，还有一个有趣的特点，那就是它有24种语言版本。这使得比较不同语言族的数据检索的准确性成为可能。

这篇文章将通过以下两个主要步骤:

从多语言文本语料库生成自定义合成问题/答案数据集
在此自定义数据集上比较OpenAI和最先进的开源embedding模型的准确性。

【译文】FinalMLP，一个简单而强大的推荐系统两流MLP模型

Sun, 25 Feb 2024 07:55:43 GMT

介绍

世界正在向数字时代发展，在这个时代，每个人都可以通过点击距离获得几乎所有他们想要的东西。可访问性、舒适性和大量的产品为消费者带来了新的挑战。我们如何帮助他们获得个性化的选择，而不是在浩瀚的选择海洋中搜索?这就是推荐系统的用武之地。

推荐系统可以帮助组织增加交叉销售和长尾产品的销售，并通过分析客户最喜欢什么来改进决策。不仅如此，他们还可以学习过去的客户行为，给定一组产品，根据特定的客户偏好对它们进行排名。使用推荐系统的组织在竞争中领先一步，因为它们提供了增强的客户体验。

在本文中，我们将重点介绍FinalMLP，这是一个旨在提高在线广告和推荐系统中点击率(CTR)预测的新模型。通过将两个多层感知器(MLP)网络与门控和交互聚合层等高级功能集成在一起，FinalMLP优于传统的单流MLP模型和复杂的双流CTR模型。作者通过基准数据集和现实世界的在线A/B测试测试了它的有效性。

除了提供FinalMLP及其工作原理的详细视图外，我们还提供了实现和将其应用于公共数据集的演练。我们在一个图书推荐设置中测试了它的准确性，并评估了它解释预测的能力，利用作者提出的两流架构。

FinalMLP: (F)特征门控层和(IN)交互层(A)聚合层(L)在两个mlp之上

FinalMLP[1]是建立在DualMLP[2]之上的两流多层感知器(MLP)模型，通过引入两个新概念对其进行增强:

基于门控的特征选择增加了两个流之间的区别，使每个流专注于从不同的特征集学习不同的模式。例如，一个流侧重于处理用户特征，而另一个流侧重于处理项目特征。
多头双线性融合改进了两个流的输出如何通过建模特征交互进行组合。使用依赖于求和或串联等线性操作的传统方法可能不会发生这种情况。

我的学习笔记

DeepSeek火爆现象背后企业可以得到什么实质提升？

DeepSeek火爆现象背后企业可以得到什么实质提升？

RAG的2024—随需而变，从狂热到理性

一、RAG技术变化

【翻译】RRF — 如何在 RAG 中对多种检索方法的结果进行评分

什么是倒数秩融合？

聊个5分钟的企业AI应用需求变化趋势

一、企业AI应用需求的底层逻辑

01用新技术解决老问题

介绍TorchV AI的两款应用，做简洁却重要的事情

写在前面

稀土掘金分享——RAG在企业应用中落地的难点与创新（文字稿）

0629讲稿

TorchV AI用户手册0609

1.引言

1.1 编写目的

1.2 读者对象

1.3 环境要求

1.4 产品架构说明

2.快速开始

LLM企业应用落地场景中的问题一览 ｜LLM ｜RAG ｜Agent ｜TorchV

前述

三个问题

【翻译】AI Agents Are All You Need

探讨实现AI Agents的三种方式，不同的方式带来不同的客群和场景 ｜LLM ｜Agent ｜RAG

【翻译】DSPY简易教程

【翻译】LLM的Function-Call简易教程

Function Calling是干什么用的？

Function Calling的结构

【翻译】神经网络背后的数学原理

1：了解基础知识

1.1： 什么是神经网络？

TorchV AI v1.0正式更新&新版官网上线

TorchV AI v1.0发布

聊聊AI应用创业心得，我们在路上|大模型应用落地场景|RAG|SaaS|PaaS|GTM|TorchV

为客户感到开心

挖掘非结构化数据的价值（1）—通过RAG实现与文件对话

连接的价值

【译文】生成式AI设计模式全面指南

为什么需要AI设计模式

设计模式列表

【译文】基于Siamese网络的zero-shot意图分类

【译文】开源多语言embedding模型对比大作战

【译文】FinalMLP，一个简单而强大的推荐系统两流MLP模型

介绍

FinalMLP: (F)特征门控层和(IN)交互层(A)聚合层(L)在两个mlp之上

LLM企业应用落地场景中的问题一览｜LLM ｜RAG ｜Agent ｜TorchV

探讨实现AI Agents的三种方式，不同的方式带来不同的客群和场景｜LLM ｜Agent ｜RAG

1.1：什么是神经网络？