news 2026/4/18 11:12:55

基于Spark的豆瓣读书分析大屏可视化(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于Spark的豆瓣读书分析大屏可视化(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码

基于Spark的豆瓣读书分析大屏可视化(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码

数据采集:豆瓣读书网站爬虫(requests、lxml、…)
数据存储:将爬取的数据保存为csv文件,保存到本地或上传到HDFS、 PySpark分析后的结果数据存储到MySQL
数据分析:不同价格区间占比、装帧类型占比、书名词云图、图书价格Top30、书籍评分Top10、评分为5星的图书Top10…等
业务系统:Flask + Echarts + HTML + …

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:48:01

GLM-4V-9B部署实录:从镜像pull到首条图文对话成功仅需8分钟

GLM-4V-9B部署实录:从镜像pull到首条图文对话成功仅需8分钟 你是不是也试过下载一个号称“本地可跑”的多模态模型,结果卡在环境报错、显存爆炸、图片上传后模型复读路径、或者干脆输出一堆乱码?别急,这次我们不讲原理&#xff0…

作者头像 李华
网站建设 2026/4/18 3:51:38

使用Jimeng LoRA优化算法设计与实现

使用Jimeng LoRA优化算法设计与实现 算法设计这事儿,有时候挺让人头疼的。你想啊,好不容易琢磨出一个思路,写出来一跑,要么慢得像蜗牛,要么内存直接爆掉。调优就更别提了,改来改去,效果没见好多…

作者头像 李华
网站建设 2026/4/18 3:52:11

EcomGPT-7B部署教程:Transformers 4.45.0避坑指南与安全版本适配

EcomGPT-7B部署教程:Transformers 4.45.0避坑指南与安全版本适配 电商从业者每天要处理成百上千条商品信息——写标题、填属性、翻英文、凑文案,重复劳动多、出错风险高、跨境合规难。有没有一个工具,能像老同事一样懂行、反应快、不嫌烦&am…

作者头像 李华
网站建设 2026/4/18 3:51:27

AI编程助手隐私安全怎么做?opencode离线模式部署详解

AI编程助手隐私安全怎么做?OpenCode离线模式部署详解 1. 为什么AI编程助手需要真正离线? 写代码时,你有没有过这样的犹豫:把公司项目拖进一个网页版AI工具里,它会不会悄悄记住我的业务逻辑?把核心算法发给…

作者头像 李华
网站建设 2026/4/17 21:50:56

Qwen3-4B Instruct-2507实战案例:DevOps自动化脚本生成

Qwen3-4B Instruct-2507实战案例:DevOps自动化脚本生成 1. 为什么DevOps工程师需要一个“会写脚本的AI搭档” 你有没有过这样的经历:凌晨两点,线上服务突然告警,排查发现是某个定时任务没跑成功;翻日志发现crontab配…

作者头像 李华
网站建设 2026/4/18 3:49:16

Pi0跨平台部署:Windows与Linux环境对比指南

Pi0跨平台部署:Windows与Linux环境对比指南 1. 为什么跨平台部署值得你花时间 刚接触Pi0模型时,我遇到的第一个实际问题不是模型效果,而是“它到底能不能在我这台电脑上跑起来”。实验室用的是Ubuntu服务器,但我的主力开发机是W…

作者头像 李华