news 2026/4/17 16:36:33

【openGauss】数据库微观案例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【openGauss】数据库微观案例

本期介绍openGauss系数据库的几个案例:

  1. rowid使用案例
  2. GUC参数非全局设定
  3. hash分区键限制

astore引擎下的rowid使用问题

Oracle迁移经常会遇到rowid兼容性问题:可能是不支持rowid,也可能是rowid类型或行为有差异。

rowid的常用场景:

  • 确保无主键表排序结果稳定性
  • 删除表中的重复记录
  • 方便DML操作定位行

很多openGauss发行版都支持了rowid功能,最近在项目中遇到一个问题,业务使用JDBC驱动pbe方式执行如下语句:

deletefromtab1whererowid=?;

执行计划走了Seq Scan,没走预期的Tid Scan

preparestmt(varchar)asselect*fromtab1whererowid=$1;postgres=# explain execute stmt('nMYAAA==5sAAAA==gAA=');QUERYPLAN--------------------------------------------------------------Seq Scanontab1(cost=0.00..230557.40rows=50000width=36)Filter:(rowid=($1)::rowid)(2rows)

如果直接使用静态值,则能走Tid Scan

postgres=# explain delete from tab1 where rowid ='nMYAAA==5sAAAA==gAA=';QUERYPLAN----------------------------------------------------------Deleteontab1(cost=0.00..4.02rows=1width=6)->Tid Scanontab1(cost=0.00..4.02rows=1width=6)TID Cond:(ctid='(49382,128)'::tid)Filter:(tableoid=50844)(4rows)

在服务端打开rowidexpr_tidscan选项后达到预期:

postgres=# explain execute stmt('nMYAAA==5sAAAA==gAA=');QUERYPLAN---------------------------------------------------------Tid Scanontab1(cost=0.01..4.02rows=50000width=36)TID Cond:(rowid=($1)::rowid)(2rows)

JDBC使用pbe方式如果没开那个选项,PBE方式会走全表扫。

GUC参数非全局设定

哪些GUC参数能使用set进行局部配置,而非cluster全局范围生效呢?

可以使用SET在user、database进行设置,有三种设置形态:

alteruserset...alterdatabaseset...alteruserindatabaseset...

但数据库里并非所有的参数都能使用set在session范围进行设置,否则可能会遇到

  • xxx cannot be changed now
  • xxx cannot be set after connection start

这类错误提示,而当前数据库内核哪些参数可以设置,我们可以使用如下代码提前了解:

DOLANGUAGEplpgsql $do$declarev_rec record;v_sqlvarchar;beginforv_recinselect*frompg_settingswherecontextnotin('internal','postmaster')loopbeginv_sql='alter database postgres set '||v_rec.name||'='||quote_literal(v_rec.setting)||';';executev_sql;raise notice'%',v_rec.name;exceptionwhenothersthen--raise notice 'state=%,error=%',SQLSTATE,SQLERRM;end;endloop;end;$do$;

分布式场景hash分区键问题

openGauss系分布式扩缩容时遇到一个问题,分析定位与分区表hash分区键类型有关。

  • 分区表使用普通的create table方式,hash分区支持分区键支持浮点数类型或时间类型。
  • 分区表使用create table including方式,hash分区分区键只支持整型。

测试语句如下:

  • 普通的create table方式可以成功
createtabletest1(idintegernotnull,widdecimal(4,4))DISTRIBUTEBYHASH(id)PARTITIONBYHASH(wid)(PARTITIONp1,PARTITIONp2,PARTITIONp3);createtabletest2(idintegernotnull,sincetimestamp)DISTRIBUTEBYHASH(id)PARTITIONBYHASH(since)(PARTITIONp1,PARTITIONp2,PARTITIONp3);

test1表的hash分区键为浮点类型,test2表的hash分区键为时间类型。

  • create table including方式失败
CREATETABLEtmp1(LIKEtest1 INCLUDING DISTRIBUTION INCLUDINGPARTITION);CREATETABLEtmp2(LIKEtest2 INCLUDING DISTRIBUTION INCLUDINGPARTITION);

复制test1表分区键类型为浮点型时,tmp1表创建失败,报错:

ERROR:numericfield overflow

复制test2表分区键类型为时间类型时,tmp2表创建失败,报错:

ERROR: invalid input syntaxfortypetimestamp:"2"

这次的分享就到这里,后续会继续分享~

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 23:10:21

PyTorch-CUDA-v2.7镜像支持HuggingFace Transformers无缝接入

PyTorch-CUDA-v2.7 镜像如何让 HuggingFace 模型开箱即用? 在深度学习项目中,你是否曾因“ImportError: CUDA not available”而卡在第一步?是否在团队协作时遇到过“我这边能跑,你那边报错”的尴尬?更别提在云服务器…

作者头像 李华
网站建设 2026/4/14 16:21:17

PyTorch-CUDA-v2.7镜像助力高校科研团队高效开展AI研究

PyTorch-CUDA-v2.7镜像助力高校科研团队高效开展AI研究 在高校人工智能实验室里,一个常见的场景是:新生入学后第一周,本应投入模型设计与实验验证,却花了整整三天在配置环境上——CUDA版本不对、cuDNN缺失、PyTorch无法识别GPU………

作者头像 李华
网站建设 2026/4/11 1:34:31

从实验到生产:PyTorch-CUDA-v2.7实现模型无缝部署

从实验到生产:PyTorch-CUDA-v2.7实现模型无缝部署 在深度学习项目中,最令人沮丧的场景之一莫过于——代码在本地跑得好好的,一上服务器却报错“CUDA not available”或“版本不兼容”。这种“在我机器上能跑”的困境,长期困扰着A…

作者头像 李华
网站建设 2026/4/11 23:04:59

清华大学开源镜像站同步PyTorch-CUDA-v2.7,国内下载飞快

清华大学开源镜像站同步 PyTorch-CUDA-v2.7,国内下载飞快 在深度学习项目启动的前五分钟,你最不想听到的一句话是什么? “pip install torch 卡在 15% 已经半小时了。” 这并非段子,而是许多国内开发者、高校研究生甚至企业工程师…

作者头像 李华
网站建设 2026/4/17 4:17:00

PyTorch-CUDA-v2.7镜像支持FP16混合精度训练,节省显存开销

PyTorch-CUDA-v2.7镜像支持FP16混合精度训练,节省显存开销 在深度学习模型日益庞大的今天,一个常见的开发痛点是:明明GPU算力强劲,却因为显存不足而被迫缩小 batch size,甚至无法加载模型。尤其是在训练Vision Transfo…

作者头像 李华
网站建设 2026/4/13 22:44:50

PyTorch-CUDA-v2.7镜像内置Python3.9,兼容主流AI框架

PyTorch-CUDA-v2.7镜像内置Python3.9,兼容主流AI框架 在深度学习项目启动阶段,你是否曾花费一整天时间只为配置好PyTorch环境?明明代码写好了,却因为CUDA版本不匹配、驱动冲突或依赖包缺失而无法运行。这种“环境地狱”几乎是每个…

作者头像 李华