`

收获,不止Oracle(顶级专家盖国强、冯春培、黄志洪等联袂力荐)

阅读更多

收获,不止Oracle顶级专家盖国强、冯春培、黄志洪等联袂力荐

梁敬彬  梁敬弘  

ISBN 978-7-121-20070-0

20134月出版

定价:59.00

480

16


编辑推荐

颠覆IT技术图书的传统写作方式,在妙趣横生的故事中学到Oracle核心知识与优化方法论,让你摆脱技术束缚,超越技术。

内容提要

在这本书里读者将会跟随作者一同对Oracle数据库的相关知识进行梳理,最终共同提炼出必须最先掌握的那部分知识,无论你是数据库开发、管理、优化、设计人员,还是从事JavaC的开发人员。接下来作者再将这部分知识中最实用的内容进一步提炼,浓缩出最精华的部分,分享给大家。这是二八现象的一次经典应用。

这部分知识就是Oracle的物理体系结构、逻辑体系结构、表、索引以及表连接五大部分。通过阅读这些章节,读者将会在最短时间内以一种有史以来最轻松的方式,完成对Oracle数据库的整体认识,不仅能在工作中解决常规问题,还能具备一定的设计和调优能力。相信通过这些章节的学习,会给读者的Oracle学习带来极大的收获。

然而,作者最希望看到的是:让读者的收获,不止Oracle

为达到此目的,作者精心将全书分成了上下两篇,刚才所描述的具体知识点体现在全书的上篇,而在下篇中,读者将通过各种精彩故事、生动案例,体会到该如何学习和如何思考,在意识的天空抛开束缚,无拘无束、尽情飞翔。

在这里,读者也许会有疑问,前面说的有史以来最轻松的方式是一种什么样的方式呢?还请亲爱的读者自己去揭晓谜底吧。

目录

上篇 开启惊喜之门——带意识地学Oracle

1章  意识,少做事从学习开始 2

1.1  选择先学什么颇有学问 2

1.1.1  梁老师课堂爆笑开场 2

1.1.2  看似跑题的手机分类 4

1.1.3  学什么先了解做什么 5

1.2  善于规划分类才有效果 7

1.2.1  分类与角色密切相关 7

1.2.2  角色自我认识有讲究 9

1.3  明白学以致用方有意义 11

2章  震惊,体验物理体系之旅 13

2.1  必须提及的系列知识 13

2.2  物理体系从老余开店慢慢铺开 16

2.2.1  老余的三个小故事 16

2.2.1.1  顾客的尺寸 16

2.2.1.2  有效的调整 17

2.2.1.3  记录的习惯 18

2.2.2  体系结构原理初探 20

2.2.2.1  从一普通查询SQL说起 20

2.2.2.2  老余故事终现用心良苦 23

2.2.2.3  一起体会Oracle代价 27

2.2.3  体系结构原理再探 30

2.2.3.1  从一普通更新语句说起 30

2.2.3.2  体系结构中提交的探讨 34

2.2.3.3  劳模的评选 38

2.2.3.4  回滚的研究 40

2.2.3.5  一致的查询 43

2.2.3.6  一致读的原理 46

2.2.3.7  实践的体会 49

2.3  体系学习让SQL性能提升千倍 65

2.3.1  一起探索体系学习的意义 65

2.3.1.1  同学们不知所学何用 66

2.3.1.2  实际上大有用武之地 67

2.3.2  单车到飞船的经典之旅 70

2.3.2.1  未优化前,单车速度 70

2.3.2.2  绑定变量,摩托速度 72

2.3.2.3  静态改写,汽车速度 74

2.3.2.4  批量提交,动车速度 75

2.3.2.5  集合写法,飞机速度 77

2.3.2.6  直接路径,火箭速度 78

2.3.2.7  并行设置,飞船速度 79

2.3.3  精彩的总结与课程展望 80

2.3.3.1  最大的收获应该是思想 80

2.3.3.2  老师的课程展望与规划 81

3章  神奇,走进逻辑体系世界 84

3.1  长幼有序的逻辑体系 84

3.2  逻辑体系从老余养殖细细说起 85

3.2.1  农场之体系逻辑结构 85

3.2.2  农场之 BLOCK 漫谈 89

3.2.3  农场之区与段 91

3.2.4  农场之表空间的分类 93

3.2.4.1  表空间与系统农场 93

3.2.4.2  表空间与临时农场 93

3.2.4.3  表空间与回滚农场 94

3.2.5  逻辑结构之初次体会 94

3.2.5.1  逻辑结构之 BLOCK 94

3.2.5.2  逻辑结构之 TABLESPACE 95

3.2.5.3  逻辑结构之 USER 97

3.2.5.4  逻辑结构之 EXTENT 97

3.2.5.5  逻辑结构之 SEGMENT 98

3.2.6  逻辑结构之二次体会 100

3.2.6.1  BLOCK的大小与调整 100

3.2.6.2  PCTFREE参数与调整 101

3.2.6.3  PCTFREE与生效范围 102

3.2.6.4  EXTENT 尺寸与调整 103

3.2.7  逻辑结构之三次体会 104

3.2.7.1  已用与未用表空间情况 104

3.2.7.2  表空间大小与自动扩展 105

3.2.7.3  回滚表空间新建与切换 109

3.2.7.4  临时表空间新建与切换 111

3.2.7.5  临时表空间组及其妙用 114

3.3  课程结束你给程序安上了翅膀 117

3.3.1  过度扩展与性能 117

3.3.2  PCTFREE与性能 120

3.3.3  行迁移与优化 123

3.3.4  块的大小与应用 124

4章  祝贺,表的设计成就英雄 131

4.1  表的设计之五朵金花 131

4.2  表的特性从老余一家展开描述 132

4.2.1  老余一家各施所长 132

4.2.2  普通堆表不足之处 132

4.2.2.1  表更新日志开销较大 133

4.2.2.2  delete无法释放空间 136

4.2.2.3  表记录太大检索较慢 139

4.2.2.4  索引回表读开销很大 140

4.2.2.5  有序插入却难有序读出 143

4.2.3  奇特的全局临时表 146

4.2.3.1  分析全局临时表的类型 146

4.2.3.2  观察各类DMLREDO 147

4.2.3.3  全局临时表两大重要特性 149

4.2.4  神通广大的分区表 153

4.2.4.1  分区表类型及原理 155

4.2.4.2  分区表最实用的特性 165

4.2.4.3  分区索引类型简述 176

4.2.4.4  分区表之相关陷阱 177

4.2.5  有趣的索引组织表 184

4.2.6  簇表的介绍及应用 187

4.3  理解表设计的你成为项目组英雄 189

5章  惊叹,索引天地妙不可言 191

5.1  看似简单无趣的索引知识 191

5.2  索引探秘从小余缉凶拉开帷幕 192

5.2.1  BTREE索引的精彩世界 192

5.2.1.1  BTREE索引结构图展现 192

5.2.1.2  到底是物理还是逻辑结构 194

5.2.1.3  索引结构三大重要特点 198

5.2.1.4  插播小余缉凶精彩故事 201

5.2.1.5  妙用三特征之高度较低 203

5.2.1.6  巧用三特征之存储列值 219

5.2.1.7  活用三特征之索引有序 248

5.2.1.8  不可不说的主外键设计 265

5.2.1.9  组合索引高效设计要领 272

5.2.1.10 变换角度看索引的危害 289

5.2.1.11 如何合理控制索引数量 295

5.2.2  位图索引的玫瑰花之刺 297

5.2.2.1  统计条数奋勇夺冠 297

5.2.2.2  即席查询一骑绝尘 302

5.2.2.3  遭遇更新苦不堪言 306

5.2.2.4  重复度低一败涂地 309

5.2.2.5  了解结构真相大白 311

5.2.3  小心函数索引步步陷阱 315

5.2.3.1  列运算让索引失去作用 315

5.2.3.2  函数索引是这样应用的 317

5.2.3.3  避免列运算的经典案例 319

5.3  索引让一系列最熟悉的SQL飞起来了 325

6章  经典,表的连接学以致用 327

6.1  表的连接之江南三剑客 327

6.2  三大类型从小余跳舞一一道来 328

6.2.1  跳舞也能跳出连接类型 328

6.2.1.1  感觉怪异的嵌套循环 328

6.2.1.2  排序合并及哈希连接 329

6.2.2  各类连接访问次数差异 330

6.2.2.1  嵌套循环的表访问次数 330

6.2.2.2  哈希连接的表访问次数 337

6.2.2.3  排序合并的表访问次数 340

6.2.3  各类连接驱动顺序区别 341

6.2.3.1  嵌套循环的表驱动顺序 341

6.2.3.2  哈希连接的表驱动顺序 343

6.2.3.3  排序合并的表驱动顺序 345

6.2.4  各类连接排序情况分析 347

6.2.4.1  除嵌套循环都需排序 347

6.2.4.2  排序只需取部分字段 347

6.2.4.3  关于排序的经典案例 349

6.2.5  各类连接限制场景对比 350

6.2.5.1  哈希连接的限制 350

6.2.5.2  排序合并的限制 353

6.2.5.3  嵌套循环无限制 355

6.3  你动手装备的表连接威震三军 355

6.3.1  嵌套循环与索引 356

6.3.2  哈希连接与索引 362

6.3.3  排序合并与索引 363

下篇  飞翔意识天空——思想与案例的分享

7章  搞定!不靠技术靠菜刀 368

7.1  SQL被一刀剁了 369

7.2  整个模块丢弃了 370

7.3  调用次数减少了 371

7.4  排序不再需要了 372

7.5  大表砍成小表了 373

7.6  排重操作消失了 373

7.7  插入阻碍小多了 374

7.8  迁移事情不做了 375

8章  升级!靠技术改隐形刀 377

8.1  大表等同小表了 378

8.2  大表切成小表了 379

8.3  索引变身小表了 380

8.4  删除动作不做了 380

8.5  清表角度变换了 381

8.6  提交次数缩减了 382

8.7  迁移越来越快了 384

8.8  SQL语句精简了 385

9章  提问,也是智慧的体现 391

9.1  描述要考虑周全 392

9.2  用词要尽量准确 393

9.3  说明要力求简洁 394

9.4  问过的避免再问 396

9.5  能搜能试不急问 396

10章  买鱼,居然买出方法论 398

10.1  小余买鱼系列故事 398

10.1.1  诊断与改进 398

10.1.2  需求与设计 401

10.1.3  资源的利用 403

10.1.4  真正的需求 404

10.2  买鱼买出了方法论 405

10.2.1  一套流程 405

10.2.2  两大法宝 407

10.3  方法论的应用案例 408

10.3.1  从我们的这一套流程说起 408

10.3.1.1  诊断 408

10.3.1.2  改进优化(首次优化) 409

10.3.1.3  需求与设计(再次优化) 410

10.3.1.4  资源利用(花絮) 412

10.3.2  案例映衬了经典两大法宝 412

11章  宝典,规范让你少做事 414

11.1  抓狂,为何事总忙不完 415

11.1.1  技术能力不足的新人们 415

11.1.2  不懂提问智慧的求助者 415

11.1.3  产生各种失误的粗心者 416

11.1.3.1  啊,小黄的DDL惹祸 416

11.1.3.2  惨,老师登错环境了 417

11.1.3.3  糟,小罗忘操作…… 417

11.1.4  解决问题缓慢的技术员 419

11.1.4.1  优化效率低下的小高 419

11.1.4.2  为何老师能快速解决 420

11.1.5  陷入种种困境的开发者 422

11.1.5.1  超长SQL使小郑烦恼 422

11.1.5.2  缺少注释让小叶沮丧 422

11.1.6  总是考虑不全的设计者 423

11.1.6.1  未提前规划的王工 423

11.1.6.2  不了解特性的刘工 424

11.2  淡定,规范少做无谓事 425

11.2.1  学习规范——促成新人快速成长 426

11.2.2  求助规范——引导求助不再迷糊 427

11.2.3  操作规范——协助粗心者不犯错 428

11.2.4  流程规范——保障问题快速解决 429

11.2.4.1  动态整体 429

11.2.4.2  动态局部 432

11.2.4.3  静态整体 439

11.2.4.4  静态局部 448

11.2.5  开发规范——让开发者驾轻就熟 451

11.2.5.1  SQL编写规范 452

11.2.5.2  PL/SQL编写规范 455

11.2.6  设计规范——助设计者运筹帷幄 457

11.2.6.1  表规范 458

11.2.6.2  索引规范 461

11.2.6.3  环境参数规范 467

11.2.6.4  命名规范 469

精彩节摘

2.3.2  单车到飞船的经典之旅

“刚才老师回答了不少同学的疑问,说明了学习体系结构还是有意义的。看来只要善于思考,善于联系,我们就能很容易地应用所学的知识解决遇到的问题。

现在我给大家讲一个具体的案例,通过执行系列等价SQL语句的性能差异,来分析其中的原因所在。

2.3.2.1  未优化前,单车速度

首先构造环境,保证下列语句执行过了,t表已经存在:

sqlplus ljb/ljb

drop table t purge;

create table t ( x int );

--将共享池清空

alter system flush shared_pool;

脚本2-29  单车到飞船试验前的准备工作

有一个开发人员写了类似如下的一个简单存储过程,实现了将110万的值插入t表的需求,具体如下:

create or replace procedure proc1

as

begin

    for i in 1 .. 100000

    loop

        execute immediate

        'insert into t values ( '||i||')';

    commit;

    end loop;

end;

----这里要记得先预先执行一遍,将过程创建起来!

脚本2-30  单车到飞船试验前构造proc1

该语句从需求实现上没有任何问题,我们执行如下:

SQL> connect ljb/ljb

已连接。

SQL> drop table t purge;

表已删除。

SQL> create table t ( x int );

表已创建。

SQL> alter system flush shared_pool;

系统已更改。

SQL> set timing on

SQL> exec proc1 ;

PL/SQL 过程已成功完成。

已用时间:  00: 00: 42.87

SQL> select count(*) from t;

  COUNT(*)

------------------------

  100000

脚本2-31  首次试验42秒完成,仅是单车速度

该语句用42秒时间完成10万条记录的插入,大家觉得速度快吗?”

1秒钟插入2千多条记录,速度好快啊!”小莲在数学上的反应还是很敏捷。

“哦,你希望还能更快一点吗?”梁老师问。

“哦,当然希望了,肯定是越快越好了。”小莲回答得不假思索。

“其实这个简单的过程如果想更快,靠的就是对体系结构的理解,下面大家跟我查询一下该过程执行中,数据库共享池中的相关情况。

共享池中缓存下来的SQL语句以及HASH出来的唯一值,都可以在v$sql中对应的SQL_TEXT SQL_ID字段中查询到,而解析的次数和执行的次数分别可以从PARSE_CALLEXECUTIONS字段中获取。

由于这个过程PROC1执行的是insert into t 的系列插入,于是我们执行如下语句来查询PROC1在数据库共享池中执行的情况,具体如下:

select t.sql_text, t.sql_id,t.PARSE_CALLS, t.EXECUTIONS

  from v$sql t

 where sql_text like '%insert into t values%';

脚本2-32  原来是因为未用绑定变量

为了让SQL语句及展现结果看起来更美观,我将上述SQLPL/SQL DEVELOPER工具中查询(这个工具有着很友好的界面,尤其适合数据库开发人员使用,因此除了介绍先前的sqlplus 工具外,这里也顺道提一下这个PL/SQL DEVELOPER工具),发现共享池中有大量的类似SQL语句,而SQL_ID各自不同,每个语句都只是解析1次,执行1次,解析了10万次了,怪不得速度如此之慢,如图2-26所示。

 

2-26  绑定变量

2.3.2.2  绑定变量,摩托速度

此时我们这么想,要是insert into t values (99898)insert into t values (99762) 等这10万条语句如果都能合并成一种写法,比如用变量代替具体值,成为insert into t values (:X) ,那岂不是这10万条语句可以被HASH成一个SQL_ID值,不就可以做到解析1次,执行10万次了?这就大大减少了解析时间。

这就是数据库的一个典型优化,绑定变量优化!

接下来我们将proc1改进为proc2,具体写法如下:

create or replace procedure proc2

as

begin

    for i in 1 .. 100000

    loop

        execute immediate

      'insert into t values ( :x )' using i;   

  commit;

    end loop;

end;

/

----这里要记得先预先执行一遍,将过程创建起来!

脚本2-33  2次改进,将proc1改造成有绑定变量的proc2

接下来我们继续执行测试proc2过程(注意表重建的目的是为了公平,测试都在无记录的空表上进行,并且共享池都清空):

SQL> drop table t purge;

表已删除。

SQL> create table t ( x int );

表已创建。

SQL> alter system flush shared_pool;

系统已更改。

SQL> set timing on

已用时间:  00: 00: 00.00

SQL> exec proc2;

PL/SQL 过程已成功完成。

已用时间:  00: 00: 08.41

SQL> select count(*) from t;

  COUNT(*)

-----------------

100000

脚本2-34  2次改进后8秒完成,单车变摩托

这次我们惊奇地发现,速度从原来的42.87秒缩减为8.41秒,大幅度提升了,每秒插入记录数达到1万多条,大大超过之前的每秒插入2千多条的速度,为什么会这么神奇呢?”梁老师停下来问大家。

“因为语句被绑定变量了,解析次数变少了!”梁老师的话同学们记得很牢。

“很好,那我们一起看看吧,看看有啥变化(如图2-27所示):

 

2-27  解析与执行次数

虽然插入的语句值各不相同,但是都被绑定为:x,所以被HASH成唯一一个HASH值,名称为dxz576128adaw,很明显可以看出解析1次,执行10万次,这就是速度大幅度提升的原因了。

这下大家对这个速度满意了吧。”

小莲这下才发现,原来简单的体系结构后面还真有不少玄机啊,也不只是上堂课梁老师说的加大减少共享池这么简单,小莲觉得今天的课太值了。

2.3.2.3  静态改写,汽车速度 

“大家还想不想再快一点?”梁老师这次开口吓了大家一跳。

“梁老师您太贪心了吧!”晶晶打趣地说道,看来课堂上同学们还真是被梁老师带动得无拘无束了,什么话都敢说啊。

“其实真的是还能再快的,你们看看这两个过程,是否觉得哪里写得有点别扭?”梁老师提醒大家认真看proc1proc2

“梁老师,这个execute immediate和双引号是啥意思啊,为什么不直接写成insert into t values (i)啊?”刚才开玩笑的曾祥也提问了。

“不错!终于看出来了,execute immediate是一种动态SQL的写法,常用于表名字段名是变量、入参的情况,由于表名都不知道,所以当然不能直接写SQL语句了,所以要靠动态SQL语句根据传入的表名参数,来拼成一条SQL语句,由execute immediate调用执行。但是这里显然不需要多此一举,因为insert into t values (i)完全可以满足需求,表名就是t啊。

我们来改写成proc3,如下:

create or replace procedure proc3

as

begin

    for i in 1 .. 100000

    loop

     insert into t values (i);   

  commit;

    end loop;

end;

/

----这里要记得先预先执行一遍,将过程创建起来!

脚本2-35  3次改进,将proc2改造成静态SQLproc3

接下来我们继续测试proc3的性能,也是在公平的环境下操作的,如下:

SQL> drop table t purge;

表已删除。

SQL> create table t ( x int );

表已创建。

SQL> alter system flush shared_pool;

系统已更改。

SQL> set timing on

SQL> exec proc3;

PL/SQL 过程已成功完成。

已用时间:  00: 00: 06.25

SQL> select count(*) from t;

  COUNT(*)

------------------

    100000

脚本2-36  3次改进后6秒完成,摩托变汽车

大家看看,现在是什么情况?” 梁老师笑着说。

“哇,又快了!”晶晶惊叫起来,引来了一片笑声。

“为什么会快了,我们分析分析,这个语句肯定有用到绑定变量,一般来说,静态SQL会自动使用绑定变量,我们来查看查看(如图2-28所示)。

 

2-28  静态SQL解析与执行次数

果然如此,proc3也实现了绑定变量,而且动态SQL的特点是执行过程中再解析,而静态SQL的特点是编译的过程就解析好了。这点差别就是速度再度提升的原因。现在大家对这个速度满意了吧。”

台下纷纷点头。

2.3.2.4  批量提交,动车速度 

“还能再快一点吗?”梁老师再次发问引发台下一片大笑,因为大家这时都认为老师是在开玩笑。

“别笑,我可不是开玩笑哦,同学们再执行这个proc3,看看有啥新发现。”

“梁老师,我看到commit了,我觉得应该放在循环的外面而不是里面。放在里面意味着每插入1条,就要提交1次,那放在循环里就要提交10万次,而放在循环外就是全部插入完后提交1次,我觉得少提交更好。”细心的小莲发现了commit 位置的不同。

“说得非常好,commit触发LGWRREDO BUFFER写出到REDO BUFFER中,并且将回滚段的活动事务标记为不活动,同时让回滚段中记录对应前镜像记录的所在位置标记为可以重写,切记commit可不是写数据的动作哦,写数据将数据从DATA BUFFER刷出磁盘是由CKPT决定的,前面大家应该有印象。

所以commit做的事情开销并不大,单次提交可能需要0.001秒即可完成。另外不管多大批量操作后的提交,仅针对commit而言,也是做这三件事,所花费的总时间不可能超过1秒。打个比方,批量100万条更新执行后完成commit的提交可能也就需要0.8秒,但是100万×0.001的时间可是远大于1×0.8的时间了。

下面我们来做做试验,将proc3改写为proc4,具体如下:

create or replace procedure proc4

as

begin

    for i in 1 .. 100000

    loop

     insert into t values (i);   

end loop;

  commit;

end;

/

----这里要记得先预先执行一遍,将过程创建起来!

脚本2-37  4次改进,将proc3改造成提交在循环外的proc4

接下来我们继续测试proc4的性能,也是在公平的环境下操作的,如下:

SQL> drop table t purge;

表已删除。

SQL> create table t ( x int );

表已创建。

SQL> alter system flush shared_pool;

系统已更改。

SQL> set timing on

SQL> exec proc4;

PL/SQL 过程已成功完成。

已用时间:  00: 00: 02.18

SQL> select count(*) from t;

  COUNT(*)

-----------------

    100000

脚本2-38  4次改进后2秒完成,汽车变动车

速度是多少?”梁老师回头看着大家。

“哇,2秒就完成了!”还是晶晶的惊叫声。

“等同于每秒5万条记录,原先可是每秒2千多条啊,不可思议!”小莲数学换算总是最快。

2.3.2.5  集合写法,飞机速度 

“还能更快吗?”梁老师没完没了啊。

“不可能!”这下同学肆无忌惮地大笑了,他们知道梁老师这回肯定是故意的了。

“不可能?看来你们又认为老师在开玩笑了,如果老师能让插入该表的动作更快,你们请老师吃饭,否则老师请你们吃饭?”

“没问题!”同学们应答得好干脆啊,他们其实心里也知道,这请客的说法一定是开玩笑,课堂的气氛被调到了最高潮了。

“好吧,同学们,大家看这条SQL语句的写法,如下:

insert into t select rownum from dual connect by level<=100000;

表示我从110万依次插入到t表中,完全满足刚才的需求,不过这种写法大家可能略感陌生,结果却是对的。现在我们执行如下:

SQL> drop table t purge;

表已删除。

SQL> create table t ( x int );

表已创建。

SQL> alter system flush shared_pool;

系统已更改。

SQL> set timing on

SQL> insert into t select rownum from dual connect by level<=100000;

已创建100000行。

已用时间:  00: 00: 00.25

SQL> commit;

提交完成。

已用时间:  00: 00: 00.00

SQL> select count(*) from t;

  COUNT(*)

-----------------

  100000

脚本2-39  5次用集合写法后0.22秒完成,动车变飞机

大家认真看看完成的时间吧。”梁老师得意地回过头望着大家。

0.25秒!”这次不再是晶晶一人的声音了,是全部同学一起喊起来了。

“每秒插入40万条,太快了吧!”小莲再次喊出声来。

“为什么会快这么多呢?其实是因为原先的过程变成了SQL,一条一条插入的语句变成了一个集合的概念,变成了一整批地写进DATA BUFFER区里,好比你要运砖头到目的地,一种是一块砖头拿到目的地,再返回拿第二块,直到拿完全部。而另一种是全部放在板车一起推至目的地,只是这里的目的地是DATA BUFFER区而已。

听明白了吗?”

“听明白了!”大家都很激动,梁老师真像一个魔术师。

“听明白就好,现在你们该好好想想请老师晚上去哪里吃饭了。”

同学们都乐了,大家心里都知道梁老师是在开玩笑。

2.3.2.6  直接路径,火箭速度

“没声音啊,看来大家怕花钱啊,要不老师再给同学们一个机会,如果我还能让这个插入语句更快,大家就请客,否则老师请客,如何?”

梁老师有完没完啊,都每秒钟40万条的速度了,还想快,疯了吧。同学们议论纷纷。

“那我开始了,因为前面完成时间都已经到零点几秒了,太小会有误差,所以我准备把数据量放大100倍,10万条改为插入1000万条,前面飞机速度的语句变成如下:

SQL> connect ljb/ljb

已连接。

SQL> drop table t purge;

表已删除。

SQL> create table t ( x int );

表已创建。

SQL> alter system flush shared_pool;

系统已更改。

SQL> set timing on

SQL> insert into t select rownum from dual connect by level<=10000000;

已创建10000000行。

已用时间:  00: 00: 23.22

SQL> commit;

脚本2-40  试验准备,将集合写法的试验数据量放大100

发现插入1000万条记录完成的时间是23秒多,大致为每秒钟43万条记录,和插入10万条记录时的速度每秒40万条大体接近,下面我们改用create table 的直接路径方式来新建t表,看看这样的方法速度能否有提升。

SQL> drop table t purge;

表已删除。

已用时间:  00: 00: 11.07

SQL> alter system flush shared_pool;

系统已更改。

已用时间:  00: 00: 00.02

SQL> set timing on

SQL> create table t as select rownum x from dual connect by level<=10000000;

表已创建。

已用时间:  00: 00: 10.14

脚本2-41  6次改进,直接路径让飞机变火箭

测试结果是,速度又有了2倍多的提升,只需要10秒即可完成,等同于插入速度为每秒钟100万条,要不是亲眼所见,还真不敢相信吧。

同学们知道这是为什么吗?真正的原因在于,insert into t select ……的方式是将数据先写到DATA BUFFER中,然后再刷到磁盘中。而create table t 的方式却是跳过了数据缓存区,直接写进磁盘中,这种方式又称之为直接路径读写方式,因为原本是数据先到内存,再到磁盘,更改为直接到磁盘,少了一个步骤,因而速度提升了许多。

直接路径读写方式的缺点在于由于数据不经过数据缓存区,所以在数据缓存区中一定读不到这些数据,因此一定会有物理读。但是在很多时候,尤其是海量数据需要迁移插入时,快速插入才是真正的第一目的,该表一般记录巨大,DATA BUFFER甚至还装不下其十分之一、百分之一,这些共享的数据意义也不大,这时,我们一般会选择直接路径读写的方式来完成海量数据的插入。

同学们,听明白了没,现在大家甘心请客了吧?”梁老师时刻不忘调侃。

台下都听呆住了,梁老师这堂课真是神了,大家半天没回过神来。

2.3.2.7  并行设置,飞船速度 

“大家这次请客是请定了,具体时间老师通知哦。”

台下哈哈大笑,大家还是回过神来了,今天这堂课给梁老师弄得一愣一愣的。

“同学们,插入语句还能再快吗?”

这下台下同学们都不敢应答了,梁老师没完没了,却每次都能不断加速,而且用到的知识又和体系知识息息相关,让自己一听就明白了。可以看出梁老师这个经典案例的例子是精心构造的,真可以说是经典中的经典。

“看来是被我给忽悠住了,大家都不敢应了。”梁老师笑着说道,“其实遇到性能好的机器,还是可以大幅度提升性能的,大家看如下语句,我设置日志关闭nologging,并且设置parallel 16 表示用到机器的16CPU,结果在笔记本环境收效不是很明显,因为我的环境是单核的机器。

后来我把如下SQL运行在强劲的服务器上,有16CPU,下面的语句仅仅在4秒不到的时间内就完成了,速度相对于前面的火箭速度而言,快多了,几乎是每秒钟300万条的插入速度,具体如下:

drop table t purge;

alter system flush shared_pool;

set timing on 

create table t nologging parallel 64 

as select rownum x from dual connect by level<=10000000;

脚本2-42  7次改进,并行原理让火箭变飞船

不过并行最大的特点就是占用了大多数CPU的资源,如果是一个并发环境,很多应用在跑,因为这个影响了别的应用,导致别的应用资源不足,将引发很多严重问题,所以需要三思而后行,了解清楚该机器是否允许你这样占用全部的资源。

好了,今天我以一条最简单的插入顺序数字进某表的SQL语句为例,方法从存储过程实现到仅用单条SQL完成;速度从原先的每秒2千多条提升到每秒300万条,这中间都做了哪些改进呢,是否都和体系结构有关呢?

希望大家好好复习这一节的经典案例,回忆一下速度的6次飞跃之旅,好好感受一下灵活应用知识的无限魅力。”

作者简介

梁敬彬,网名wabjtam123,任ITPUB版主、ITPUB社区专家、福建富士通公司数据库专家。参与编写过《剑破冰山——Oracle开发艺术》、《DBA手记2》等技术书籍,多年从事电信相关行业工作,负责系统架构设计、优化、培训等工作,有着丰富的数据库管理、设计、开发、培训经验和电信行业经验。

梁敬弘,清华大学计算机系博士毕业,在计算机领域和金融领域皆有建树,拥有多项计算机相关核心专利技术的同时还拥有金融行业的CFP等高级认证。现就职于华夏银行总行。

媒体评论

我在ITPUB认识梁敬彬先生始,就拜读他当时参与的大作《剑破冰山——Oracle开 发艺术》,直至今天,这本书里的部分内容在行业里还发挥着重要影响力。从事数据库事业多年,读过无数的技术书,有洋洋万言的,有短小精悍的,但大多写得正 儿八经,有距离感,还有点冷。梁敬彬先生的新书,用生动的故事形式叙述复杂技术,开创数据库技术书籍故事化的写作先河。梁先生技术功底和文字功底同样深 厚,更重要的是具有作为讲师那种缜密、体系化的思维方式,以及对读者心思的透视力,因此成书脉络清晰,里面还不断穿插许多人生哲理,技术前瞻,让人获益良 多。这本书非常适合入行者和在行业里谋求上升的同仁阅读,动人的文笔可以让你一口气读完这本书,而且完全没有读其它技术书籍时那种头晕脑胀,昏昏入睡的感 觉。这是一本值得向行业推介的优秀技术书籍。

黄志洪(tigerfish) www.dataguru.cn

中国数据库社区ITPUB创始人

多年前作为DBA时 我曾经总结过,到底是什么后天原因能导致人和人之间的学习结果发生重大差异,其中有一点就是思维方式。于是我尝试在思维方式方面去影响身边的一些人,最后 这些人在各自的领域也都获得了成功,而在此之前他们却是默默无闻。思维方式可以由长期的训练而固化下来,但若是无人在身边影响你,那么最好就是你自己有意 识的发生改变。

敬彬此书就是用诙谐幽默的语言生动地引导大家在意识层面发生改变,然后逐步转化为行动上的改变,按此坚持几年下来,相信每个人都能迈上自己新的台阶,这的确早已超越oracle的范畴,对我们诸多方面都有益处。

冯春培 (biti_rainy)

支付宝平台数据部资深总监

敬彬兄这本书有着与市场上其他Oracle书籍与众不同的特点,他通过一个个精彩的小故事,串起Oracle的核心知识和优化方法论,并时刻强调学习和工作的意识,如何不被技术束缚,如何跳出技术,意识和方法真的很重要。相信读完本书,你的收获,绝对不止Oracle

丁俊(dingjun123

ITPUB Oracle开发版资深版主 

《剑破冰山——Oracle开发艺术》副主编

通读本书,如醍醐灌顶,豁然开朗,本书从实战出发,出发于技术,而超脱于意识,回味无穷,作者拥有多年的Oracle应用和体系架构设计的经验,付出了不亚于任何人的努力,总结出众多独到的经验,不失为一本好书,为学习和使用Oracle的技术人员带来诸多益处。

傅祥文

福富软件公司运营总监

由梁敬彬、梁敬弘兄弟合作的《收获,不止Oracle》 一书问世了。这对学习和从事数据库相关事务的业内人员来说,是一件幸事。读一本技术方面的书,或修一门课程、听一个讲座,大凡可能有三方面的收获:掌握相 关的知识,提高解决问题的能力,激发学习、探讨有关问题的兴趣和热情。这些可能的收获不在一个层面上,后两者更为可贵。梁敬彬梁敬弘兄弟的这本书恰恰给读 者提供了这样的机会。当然,要有真收获,还要有真努力。 

梁敬弘曾是我的学生,不仅学业专精,围棋也下得很不错,是一个真诚而聪明的小伙子,跟他的哥哥相比,内向一些。梁敬彬与弟弟相比更善于沟通和表达,是一个数据库方面的专家,也是一个很好的教师。在此,预祝本书的出版获得成功,同时也祝兄弟二人在事业上不断取得新的成就。

黄连生

清华大学计算机系教授

曾经有Oracle的初学者问我,怎么开始学习Oracle?那时候我的答案很简单:“去下载Oracle的在线文档,包括Database ConceptAdministrators Guide,然后开始学着做实验。”诚然,对学习技术而言,在线文档是一个不可多得的利器,但是,对于一个刚刚开始接触Oracle的人来说,要从枯燥的英文文档中去学习和理解Oracle的技术体系,也许有点勉为其难。 就算是市面上众多的Oracle技术书籍,多数也是堆砌满了技术细节,随时可能吓跑初学者。

好在,现在梁敬彬先生通过自己在日常工作和培训中的磨练,把自己对Oracle技术的感悟,通过一个一个的小故事,浅显而又形象地展现了出来。对于初学者来说,可以慢慢地在一个个小故事中去了解Oracle数据库。读完这本书,你也许会恍然大悟:“哦,原来Oracle是这样子的。”

罗海雄(rollingpig

ITPUB Oracle管理版资深版主

前言

别出心裁 另出蹊径

                        ——与梁敬彬先生序

敬彬的新书就要出版,邀我写一点感受,于是就有了这一段文字。

我和敬彬相识是在2010年,那时我正在编辑《Oracle DBA手记》一书,偶然被他发表在ITPUB论坛上的一篇文章所吸引,那篇文章的题目是《DBA 小故事之SQL诊断》,其内容清晰、行文引人,于是就和他约了那篇稿子加入到书中,期间邮件往来再到北京会面,就此熟识。

从当时的一篇文章到今天的一本书,我能够清晰地看到作者一以贯之的思考和叙述方式,这种积累与坚持也正是作者成长和成功的要素之一。

当时那篇文章的感受和今天这本书是类似的,作者能够用曲折的笔触将自己的经历真实生动地再现出来,并且带领读者一起经历一次思维的探索,这是属于他的独特风格。

作者在书中反复传达的核心观点是:Oracle数据库看似艰深的原理实际上和生活中的基本常识并无二致。理解了这一层意思,就能够克服对于这门技艺的畏惧之心,此后的学习自然就能够顺风顺水。

诚然如此,我也经常和朋友们说,对于Oracle的很多艰深算法,如果由我们去深思熟虑,其结果都必然大致相同。类似HASH原理,布隆过滤等算法,理解了你就只觉得巧妙而不觉艰深。

现在梁老师就为我们寻找了一系列源于生活、循序渐进的学习路线,如果你能够细心领会,就会觉得这一门技艺实在是趣味横生。

盖国强(eygle

Oracle ACE总监

云和恩墨创始人

ACOUG创始人

1
8
分享到:
评论

相关推荐

    Oracle内存分配与调整--大牛冯春培的一篇文章

    Oracle内存分配与调整--大牛冯春培的一篇文章 文章条理清楚,讲解深入浅出,非常值得一看。

    2012年数据库技术大会演讲PPT.zip

    盖国强—Oracle之道 - 数据库安全与深入恢复实践 杨宁——oracle攻防与SOX审计 蔡峰——轻松解决异构数据同步:赶集网CDC数据同步方案实践 专场1:Oracle应用实践专场—演讲嘉宾及主题 杨廷琨—Think Different - ...

    Java毕业设计-基于Springboot+Vue旅游网站设计-源码+数据库+使用文档+演示视频(高分项目).zip

    Java毕业设计-基于Springboot+Vue旅游网站设计-源码+数据库+使用文档+演示视频(高分项目).zip本资源中的源码都是经过本地编译过可运行的,评审分达到95分以上。资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、使用需求,如果有需要的话可以放心下载使用。 Java毕业设计-基于Springboot+Vue旅游网站设计-源码+数据库+使用文档+演示视频(高分项目).zipJava毕业设计-基于Springboot+Vue旅游网站设计-源码+数据库+使用文档+演示视频(高分项目).zipJava毕业设计-基于Springboot+Vue旅游网站设计-源码+数据库+使用文档+演示视频(高分项目).zipJava毕业设计-基于Springboot+Vue旅游网站设计-源码+数据库+使用文档+演示视频(高分项目).zipJava毕业设计-基于Springboot+Vue旅游网站设计-源码+数据库+使用文档+演示视频(高分项目).zipJava毕业设计-基于Springboot+Vue旅游网站设计-源码+数据库+使用文档+演示视频(高分项目).zip

    Music-app-master.zip

    Music-app-master

    基于springboot的权限管理系统.zip

    基于springboot的java毕业&课程设计

    外东洪路中段.m4a

    外东洪路中段.m4a

    基于matlab+Simulink模拟的微电网系统包括包括电源、电力电子设备等+源码+开发文档(毕业设计&课程设计&项目开发)

    基于matlab+Simulink模拟的微电网系统包括包括电源、电力电子设备等+源码+开发文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用~ 项目简介: 这是一个完整的微电网模型,包括电源、电力电子设备、使用MatLab和Simulink的负载和电源模型。该模型基于费萨尔·穆罕默德的硕士论文《微网格建模与仿真》。 什么是微电网 模拟的微电网使用一组电源和负载在与任何集中式电网(宏电网)断开连接的情况下工作,并自主运行,为其局部区域提供电力。该仿真对微电网在稳态下进行建模,以分析其对输入变化的瞬态响应。 此模拟的目的 对系统进行全年模拟,测量负载、产量、电压和频率。 给出简化规划和资源评估阶段的方法。

    MySQL8.4.0 LTS(mysql-server-8.4.0-1debian12-amd64.deb-bundle)

    MySQL8.4.0 LTS(mysql-server_8.4.0-1debian12_amd64.deb-bundle.tar)适用于Debian 12 Linux (x86, 64-bit)

    改进混沌游戏优化(ICgo)matlab代码.zip

    1.版本:matlab2014/2019a/2021a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    基于SpringBoot,SpringCloud的微服务大型在线学习平台实现.zip

    基于springboot的java毕业&课程设计

    圣经投屏软件(5种语言版本)

    圣经投屏软件(5种语言版本)

    基于SpringBoot,Spring Security实现的前后端分离权限管理简易系统.zip

    基于springboot的java毕业&课程设计

    jSP在线教学质量评价系统的设计与实现(源代码)

    在线教学质量评价系统可以方便和全面地收集教师教学工作的数据,提供师生网上评教的评分结果,快速集中收集各方面的评教信息,使教务管理部门能够及时了解教学动态和师资情况,为教务老师提供相关决策支持,为职称评聘提供教学工作质量的科学依据,同时减轻了教务老师的工作量。

    测障测角小车程序+仿真电路DSN文件+设计报告doc.zip

    包含作品的设计论文doc文档+测障测角小车程序+仿真电路DSN文件,可直接修改,适合于电赛备赛、课程设计、毕设参考等。 设计制作了一款具有智能判断功能的小车,功能强大。小车具有以下几个功能:自动避障功能;寻迹功能(按路面的黑色轨道行驶);趋光功能(寻找前方的点光源并行驶到位);检测路面所放置的铁片的个数的功能;计算并显示所走的路程和行走的时间,并可发声发光。作品可以作为大学生学习嵌入式控制的强有力的应用实例。     作品以两电动机为主驱动,通过各类传感器件来采集各类信息,送入主控单元AT89S52单片机,处理数据后完成相应动作,以达到自身控制。电机驱动电路采用高电压,高电流,四通道驱动集成芯片L293D。其中避障采用红外线收发来完成;铁片检测部分采用电感式接近开关LJ18A3-8-Z/BX检测;黑带检测采用红外线接收二极管完成;趋光部分通过3路光敏二极管对光源信号的采集,再经过ADC0809转化为数字信号送单片机处理判别方向。由控制单元处理数据后完成相应动作,实现了无人控制即可完成一系列动作,相当于简易机器人。 关键字:智能控制   蔽障  红外线收发  寻迹行驶  趋光行驶

    基于Python卷积神经网络人脸识别驾驶员疲劳检测与预警系统设计

    1412基于Python卷积神经网络人脸识别驾驶员疲劳检测与预警系统设计毕业源码案例设计 卷积神经网络(Convolutional Neural Networks, CNNs 或 ConvNets)是一类深度神经网络,特别擅长处理图像相关的机器学习和深度学习任务。它们的名称来源于网络中使用了一种叫做卷积的数学运算。以下是卷积神经网络的一些关键组件和特性: 卷积层(Convolutional Layer): 卷积层是CNN的核心组件。它们通过一组可学习的滤波器(或称为卷积核、卷积器)在输入图像(或上一层的输出特征图)上滑动来工作。 滤波器和图像之间的卷积操作生成输出特征图,该特征图反映了滤波器所捕捉的局部图像特性(如边缘、角点等)。 通过使用多个滤波器,卷积层可以提取输入图像中的多种特征。 激活函数(Activation Function): 在卷积操作之后,通常会应用一个激活函数(如ReLU、Sigmoid或tanh)来增加网络的非线性。 池化层(Pooling Layer): 池化层通常位于卷积层之后,用于降低特征图的维度(空间尺寸),减少计算量和参数数量,同时保持特征的空间层次结构。 常见的池化操作包括最大池化(Max Pooling)和平均池化(Average Pooling)。 全连接层(Fully Connected Layer): 在CNN的末端,通常会有几层全连接层(也称为密集层或线性层)。这些层中的每个神经元都与前一层的所有神经元连接。 全连接层通常用于对提取的特征进行分类或回归。 训练过程: CNN的训练过程与其他深度学习模型类似,通过反向传播算法和梯度下降(或其变种)来优化网络参数(如滤波器权重和偏置)。 训练数据通常被分为多个批次(mini-batches),并在每个批次上迭代更新网络参数。 应用: CNN在计算机视觉领域有着广泛的应用,包括图像分类、目标检测、图像分割、人脸识别等。 它们也已被扩展到处理其他类型的数据,如文本(通过卷积一维序列)和音频(通过卷积时间序列)。 随着深度学习技术的发展,卷积神经网络的结构和设计也在不断演变,出现了许多新的变体和改进,如残差网络(ResNet)、深度卷积生成对抗网络(DCGAN)等。

    基于Vue + SpringBoot实现的前后端分离的仿小米商城项目.zip

    基于springboot的java毕业&课程设计

    QKD 协议密钥率的数值评估matlab代码.zip

    1.版本:matlab2014/2019a/2021a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    基于springboot校园社团管理.zip

    基于springboot的java毕业&课程设计

    基于卷积神经网络的城市感知评估.zip

    卷积神经网络(Convolutional Neural Networks, CNNs 或 ConvNets)是一类深度神经网络,特别擅长处理图像相关的机器学习和深度学习任务。它们的名称来源于网络中使用了一种叫做卷积的数学运算。以下是卷积神经网络的一些关键组件和特性: 卷积层(Convolutional Layer): 卷积层是CNN的核心组件。它们通过一组可学习的滤波器(或称为卷积核、卷积器)在输入图像(或上一层的输出特征图)上滑动来工作。 滤波器和图像之间的卷积操作生成输出特征图,该特征图反映了滤波器所捕捉的局部图像特性(如边缘、角点等)。 通过使用多个滤波器,卷积层可以提取输入图像中的多种特征。 激活函数(Activation Function): 在卷积操作之后,通常会应用一个激活函数(如ReLU、Sigmoid或tanh)来增加网络的非线性。 池化层(Pooling Layer): 池化层通常位于卷积层之后,用于降低特征图的维度(空间尺寸),减少计算量和参数数量,同时保持特征的空间层次结构。 常见的池化操作包括最大池化(Max Pooling)和平均池化(Average Po

Global site tag (gtag.js) - Google Analytics