news 2026/4/18 6:39:54

为什么我不建议你再写SQL取数了?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
为什么我不建议你再写SQL取数了?

最近一直在摸索如何用AI解决实际的业务问题,发现AI在调用数据库和处理数据上有些发挥的空间,于是我做了一个自动化数据处理的智能体,名叫“数分神器”,有以下3个核心功能:

1、支持连接SQLite数据库,并实现抽取、写入的功能

2、支持SQL、Python处理数据,按要求进行数据清洗、转换、透视等

3、支持导出数据报告,并生成matplotlib图表

这3个功能能涵盖ETL和数据分析的基本工作,也就是说AI可以替代这些初级岗位,而且能把活干的更高效、漂亮。

不得不感慨,那些靠SQL取数保住的饭碗可能真的要被AI砸碎了。

要搭建这个智能体,需要用到3个至关重要的工具。

首先是SQLite数据库,这是一个轻量化的开源数据库,它没有服务器,无需复杂的配置安装,就可以直接用,很适合制作AI应用。有个冷知识,微信就是依赖SQLite进行数据存储和管理的。

其次要用到Trae编辑器,这是一个AI原生的代码编辑器,是基于VsCode内核开发的,所以它有VsCode的几乎所有功能,最重要的是它支持直接部署大模型、智能体、MCP等,可以理解它就是一个超级编程智能体。

最后还要用到SQLite MCP,这是一个专门用于操作本地SQLite数据库的MCP服务,所谓MCP服务即“模型上下文协议”,是大模型与外部工具的连接标准,就像电脑之于USB一样。SQLite MCP能支持AI自动查询、读取、操作数据库,完全不需要手工干预。

下面来讲讲具体步骤。

1、安装SQLite数据库

以windows系统为例,从SQLite网站直接下载安装包,解压到本地即可,无需额外安装。

你会看到解压后出现4个应用程序文件,不用任何操作, 因为SQLite就是开箱即用。

接着你可以创建一个名为‘my_db’的数据库,在命令行里输入:

sqlite3 my_db.db

这样你就直接创建了一个SQLite数据库文件,请复制它的文件路径地址,留着备用。

比如D:\sqlite\my_db.db

2、安装Trae

这一步就更不用多说了,Trae是开源软件,安装和Vscode一样,非常简单。

Trae还提供多种免费模型,不限制tokens,比如DeepSeek、Qwen、Doubao、Kimi等。

安装好后,你可以配置下Python开发环境,也就是安装Python插件,找到本地Python路径,就可以在Trae里进行Python开发了。

Trae有个AI侧栏,可以进行AI编程,或者搭建智能体,这是后面要用到的功能,也是Trae的核心能力。

3、部署SQLite MCP

Trae有个MCP集市,里面有各种功能的MCP,也可以自己添加特定MCP服务。

SQLite MCP就是现成的,能直接从集市里添加,然后在配置信息里输入前面的my_db.db数据库路径地址,保存即可。

这样你就配置好了SQLite MCP服务,AI可以直接访问你的数据库文件。

4、创建智能体

接下来,咱们需要创建一个名为“数分神器“的智能体,来调用MCP执行任务。

这里要注意两点,首先“数分神器“智能体需勾选SQLite MCP服务,其次要设置默认提示词,告诉智能体它的角色和任务。

创建好智能体后就可以直接与它对话,它会根据需求调用SQLite MCP,并处理数据,或者形成一份数据报告。

接下来咱们列举几个常见的数据库处理场景,以某月份车型销量数据为例,该数据已经提前存储在SQLite数据库中。

1、从SQLite中抽取数据

任务:从表model_sales_202509中提取数据,保存到csv中。规则提取sales排名前20、且price不超过20万的model,提取的字段包括rank、model、sales、brand、price。

智能体会尝试连接SQLite数据库,并查询相关表结构,按照要求抽取数据。

最终它输出了一份CSV数据,内容完全符合设定的取数需求,你看这个功能就替代了SQL人工取数的工作,你如果在做这个会感到焦虑嘛?

2、向SQLite中写入数据

任务:将文件model_sales_top20_under20w.csv数据批量全部写进数据库中,表命名为model_sales_top20_under20w

最后,表model_sales_top20_under20w成功出现在了SQLite数据库中。

3、从SQLite中抽取数据,形成分析报告

任务:从表model_sales_202509抽取数据,并进行数据分析,形成分析报告(包含图表),要求如下:

1、分析车型销量与价格的关系

2、分析不同品牌车型数量与总销量之间的关系,是否车型越多销量越高?

3、分析比亚迪主要车型的销量情况,以及其价格分布

最后,生成了一份分析报告,并配有7张图表。

分析报告和可视化图表如下:

从以上输出的内容可以看到,“数分神器”智能体可以非常灵活的处理SQLite数据,并使用Python等工具处理数据、制作图表,颜值、专业性都还不错,堪当一个初级分析师。

这是我将AI应用到实际工作的一个尝试,虽然有很多地方还不算满意,比如处理速度、研究深度等,但AI已经能达到初级工程师的水平,这是毋庸置疑的,再经过调教优化,会逐步进阶到中高级水平。

如果用一句话来形容AI带来的改变,我想是:忽如一夜春风来,千树万树梨花开。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 14:07:17

Effective C++学习笔记

一.视C为一个语言联邦融合了多种编程思维方式C 同时支持四种编程范式(paradigms)procedural-based(过程式) object-based(基于对象) object-oriented(面向对象) generics&#xff08…

作者头像 李华
网站建设 2026/4/18 6:37:27

PyTorch-CUDA-v2.6镜像中使用Albumentations进行数据增强

PyTorch-CUDA-v2.6 镜像中使用 Albumentations 进行数据增强 在深度学习项目开发中,图像任务的训练效率和模型泛化能力往往不只取决于网络结构本身,更多时候受限于环境稳定性与数据质量。尤其是在目标检测、医学影像分割等对标注精度要求极高的场景下&am…

作者头像 李华
网站建设 2026/4/5 14:30:46

通俗解释USB接口有几种命名规则

一根线的进化史:为什么USB接口越来越“难懂”?你有没有过这样的经历?买了一根号称“高速传输”的USB线,结果拷贝一个4K视频比蜗牛还慢;给笔记本连扩展坞时,发现明明插的是USB-C口,却无法输出视频…

作者头像 李华
网站建设 2026/4/16 18:53:09

北京大学国家发展研究院 经济学辅修 经济学原理课程笔记(第十五章 劳动力市场)

文章目录第十五课 劳动力市场劳动力是一种生产要素生产要素的定义派生需求劳动力的独特性劳动力质量的影响因素完全竞争企业对劳动力的需求基本假设:双重价格接受者决策逻辑的转换:从边际成本到边际产量劳动力市场的决策法则案例表格分析劳动力的需求曲线…

作者头像 李华
网站建设 2026/4/6 8:44:55

Agisoft Metashape Pro(3D摄影建模软件)

链接:https://pan.quark.cn/s/19a0d5b41286Agisoft Metashape是一款专业的三维模型设计软件。软件根据最新的多视图三维重建技术,可以对任意照片进行处理,无需控制点;也可以通过给予的控制点生成真实坐标的三维模型。操作简单&…

作者头像 李华