news 2026/4/18 5:27:57

非结构化数据的隐私性较低吗?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
非结构化数据的隐私性较低吗?

从听过任何关于人工智能讨论的调查来看,我们都知道隐私很重要。

我们一次又一次地听到人们谈论如何实现某种类型的人工智能系统,但他们担心涉及的隐私问题。

有时候,从整体格局的细致角度来看,能让我们看到如何做得更好。

例如,新系统越来越能够分析非结构化数据,并将所有相关数据点聚合成统一整体。

这对隐私意味着什么?非结构化数据本质上就不那么个人化,也不那么敏感吗?

把这大量非结构化数据看作是涵盖各种可能涉及任何内容的信息的总包。从这个角度看,从这么宽广的字段获取数据似乎比收集一个精心填充的数据库(里面有人员身份和可能的敏感财务信息如账号等)要小得多。

但你仍然可以有一些相当私密的数据存在于非结构化数据集中。例如,一封与某人HIPAA信息相关的信件,至少在肉眼看来可能没有包含这些内容。但当你用更强大的引擎拿回洞察时,你可能会发现机器能够从一些意想不到的地方提取敏感数据。

社交媒体的例子就是看待这个问题的一种方式。社交媒体是非结构化数据——我们都知道这一点——我们习惯在Facebook或 X 或微博 或在这上看到各种关于自己的故事。你可能会想,嗯,它没有我的社会安全号码或银行账户号码。但鱼叉式钓鱼者并不总是需要这些标识符,只要他们有正确的故事。此外,人工智能可能能够整合各种推断、时间线和影响,构建出令人恐惧的个人故事。比如想想保险欺诈侦探如何利用社交媒体。它可能会抓到欺诈行为——但侵入性有多大?

那么,新的人工智能系统是如何做到这一点的呢?如果你看硬件,我们正进入一个人工智能可以从更结构化数据集转向一种通用技术,吸收大量数据,以至于你可能会认为它接近普世知识的时代。

在最近一次参与某个AI活动中,一位专家谈到了一款拥有90万个核心和40亿晶体管的芯片,它便于扩展并消除并行编程。但她指出,这些系统在处理非结构化数据方面也更有能力。额外的能力有助于搜寻更广泛的知识库并收集你想要的东西。

“如今我们能够在单一系统上运行巨大的模型。因此,我们可以通过数据并行性快速且便捷地扩展。因此,不需要像威震天那样复杂的并行编程库......作为企业,通过开发者使用我们的系统,他们可以专注于人工智能,而非复杂的并行编程。因此,他们可以更快地开始和扩展工作。

一个视角是数据治理。你可以识别数据在AWS对象存储中的位置,以及随之而来的元数据。你可以开始分析AI是否能够从它通过非结构化数据中收集到的零碎信息构建敏感信息模型。首先,正如许多人现在问的那样:谁拥有这些数据?

随着进展,我们将开始看到隐私威胁的所在。或者如果我们不这样做,可能会在用户的个人体验层面看到这些问题,人们理所当然地感到不满。

我得说硬件本身相当令人印象深刻。这些工艺远远超出了多核技术的简单概念。看起来他们会把明天的数据中心变成你手中拿着的东西。

无论如何,当我们思考非结构化数据时,我们应该考虑它被简化、精炼和精炼后会是什么样子,机器能从中推测出关于你的一切!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 4:04:27

AntiDupl.NET:彻底告别重复图片困扰的智能清理神器

AntiDupl.NET:彻底告别重复图片困扰的智能清理神器 【免费下载链接】AntiDupl A program to search similar and defect pictures on the disk 项目地址: https://gitcode.com/gh_mirrors/an/AntiDupl 在数字存储空间日益珍贵的今天,图片重复问题…

作者头像 李华
网站建设 2026/4/18 3:58:40

31、基于FluidSynth的卡拉OK系统开发指南

基于FluidSynth的卡拉OK系统开发指南 1. 字幕与卡拉OK适用性分析 在视频图像上叠加字幕文本是可行的,但目前似乎没有机制能逐步高亮一行中的单词。虽然JavaScript可能有实现的潜力,但初步观察发现不太可能,所以当前这种情况还不适用于卡拉OK。 2. FluidSynth简介 FluidS…

作者头像 李华
网站建设 2026/4/18 4:05:11

35、树莓派音频功能全解析

树莓派音频功能全解析 树莓派硬件概述 树莓派不同型号采用了不同的处理器。除了2B/3B型号,其他版本和修订版使用Broadcom BCM2835,它包含一个运行频率为700MHz且支持浮点运算的ARM1176JZFS处理器,以及一个VideoCore 4 GPU,该GPU能够以40MBits/s的速率播放H.264编码的蓝光…

作者头像 李华
网站建设 2026/4/18 4:03:35

Vue项目设计与搭建全攻略:从0到1搭建可扩展前端项目

引言:在前端开发领域,Vue.js凭借其轻量、易用、渐进式的特性,成为众多开发者构建单页应用(SPA)的首选框架。无论是个人项目还是企业级应用,一套规范的设计思路和搭建流程,都能极大提升开发效率、…

作者头像 李华
网站建设 2026/4/17 16:35:08

51单片机概述

目录 一、硬件底层:最小系统与引脚深度解析 1. 最小系统核心组成(缺一不可) 2. I/O 口底层特性(P0~P3 口逐口拆解) 二、寄存器体系:硬件配置的核心(SFR 详解) 1. 核心控制寄存器…

作者头像 李华
网站建设 2026/4/18 4:03:33

1小时打造智能WiFi放大器监控原型

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个WiFi放大器监控看板原型,要求:1. 实时显示连接设备数 2. 各节点信号强度可视化 3. 流量使用图表 4. 异常报警功能 5. 支持移动端查看。使用MQTT协议…

作者头像 李华