oracle的表空间,表分区及索引之间的关系;各位大虾给分析一下这个建表语句;

默认分类 未结 1 1533
0教务处0
0教务处0 2023-03-18 05:46
相关标签:
1条回答
  • 2023-03-18 06:14

    (1). 表空间及分区表的概念

    表空间:  是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。

    分区表: 当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。

    (2).什么时候使用分区表:1、表的大小超过2GB。

    2、表中包含历史数据,新的数据被增加都新的分区中。

    (3).表分区的优缺点

    表分区有以下优点: 1、改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。

    2、增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;

    3、维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;

    4、均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能。

    缺点: 分区表相关:已经存在的表没有方法可以直接转化为分区表。不过 Oracle 提供了在线重定义表的功能。

    (4).分区表的几种类型及其操作方法

    一.范围分区:范围分区将数据基于范围映射到每一个分区,这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期。举个例子:你可能会将销售数据按照月份进行分区。

    当使用范围分区时,请考虑以下几个规则:

    1、每一个分区都必须有一个VALUES LESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。

    2、所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。

    3、在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUE LESS THEN的值,同时包括空值。

    例一:

    假设有一个CUSTOMER表,表中有数据200000行,我们将此表通过CUSTOMER_ID进行分区,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码,如下:

    CREATE TABLE CUSTOMER ( CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY, FIRST_NAME VARCHAR2(30) NOT NULL, LAST_NAME VARCHAR2(30) NOT NULL, PHONE VARCHAR2(15) NOT NULL, EMAIL VARCHAR2(80), STATUS CHAR(1) ) PARTITION BY RANGE (CUSTOMER_ID) ( PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01, PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02 )

    例二:按时间划分

    CREATE TABLE ORDER_ACTIVITIES ( ORDER_ID NUMBER(7) NOT NULL, ORDER_DATE DATE, TOTAL_AMOUNT NUMBER, CUSTOTMER_ID NUMBER(7), PAID CHAR(1) ) PARTITION BY RANGE (ORDER_DATE) (

    PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE(‘01- MAY -2003‘,‘DD-MON-YYYY‘)) TABLESPACEORD_TS01,

    PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE(‘01-JUN-2003‘,‘DD-MON-YYYY‘)) TABLESPACE ORD_TS02,

    PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE(‘01-JUL-2003‘,‘DD-MON-YYYY‘)) TABLESPACE ORD_TS03

    )

    例三:MAXVALUE

    CREATE TABLE RangeTable( idd INT PRIMARY KEY , iNAME VARCHAR(10), grade INT ) PARTITION BY RANGE (grade) ( PARTITION part1 VALUES LESS THEN (1000) TABLESPACE Part1_tb, PARTITION part2 VALUES LESS THEN (MAXVALUE) TABLESPACE Part2_tb );

    二.列表分区:

    该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。

    例一

    CREATE TABLE PROBLEM_TICKETS ( PROBLEM_ID NUMBER(7) NOT NULL PRIMARY KEY, DESCRIPTION VARCHAR2(2000), CUSTOMER_ID NUMBER(7) NOT NULL, DATE_ENTERED DATE NOT NULL, STATUS VARCHAR2(20) ) PARTITION BY LIST (STATUS) ( PARTITION PROB_ACTIVE VALUES (‘ACTIVE‘) TABLESPACE PROB_TS01, PARTITION PROB_INACTIVE VALUES (‘INACTIVE‘) TABLESPACE PROB_TS02

    例二

    CREATE TABLE ListTable( id INT PRIMARY KEY , name VARCHAR (20), area VARCHAR (10) ) PARTITION BY LIST (area) ( PARTITION part1 VALUES (‘guangdong‘,‘beijing‘) TABLESPACE Part1_tb, PARTITION part2 VALUES (‘shanghai‘,‘nanjing‘) TABLESPACE Part2_tb );

    )

    三.散列分区:这类分区是在列值上使用散列算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。

    散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。

    例一:

    CREATE TABLE HASH_TABLE ( COL NUMBER(8), INF VARCHAR2(100) ) PARTITION BY HASH (COL) ( PARTITION PART01 TABLESPACE HASH_TS01, PARTITION PART02 TABLESPACE HASH_TS02, PARTITION PART03 TABLESPACE HASH_TS03 )

    简写:

    CREATE TABLE emp( empno NUMBER (4), ename VARCHAR2 (30), sal NUMBER )PARTITION BY HASH (empno) PARTITIONS 8STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);

    hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数,Oracle中如果你要使用hash分区,只需指定分区的数量即可。建议分区的数量采用2的n次方,这样可以使得各个分区间数据分布更加均匀。

    四.组合范围散列分区这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。

    CREATE TABLE SALES (

    PRODUCT_ID VARCHAR2(5),

    SALES_DATE DATE,

    SALES_COST NUMBER(10),

    STATUS VARCHAR2(20)

    )

    PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)

    (

    PARTITION P1 VALUES LESS THAN(TO_DATE(‘2003-01-01‘,‘YYYY-MM-DD‘))TABLESPACE rptfact2009 ( SUBPARTITION P1SUB1 VALUES (‘ACTIVE‘) TABLESPACE rptfact2009, SUBPARTITION P1SUB2 VALUES (‘INACTIVE‘) TABLESPACE rptfact2009 ), PARTITION P2 VALUES LESS THAN (TO_DATE(‘2003-03-01‘,‘YYYY-MM-DD‘)) TABLESPACE rptfact2009 ( SUBPARTITION P2SUB1 VALUES (‘ACTIVE‘) TABLESPACE rptfact2009, SUBPARTITION P2SUB2 VALUES (‘INACTIVE‘) TABLESPACE rptfact2009 ) )

    五.复合范围散列分区:

    这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,然后再按某列进行散列分区。

    create table dinya_test ( transaction_id number primary key, item_id number(8) not null, item_description varchar2(300), transaction_date date ) partition by range(transaction_date)subpartition by hash(transaction_id) subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03) ( partition part_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)), partition part_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)), partition part_03 values less than(maxvalue) );

    (5).有关表分区的一些维护性操作: 一、添加分区 以下代码给SALES表添加了一个P3分区

    ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE(‘2003-06-01‘,‘YYYY-MM-DD‘));

    注意:以上添加的分区界限应该高于最后一个分区界限。

    以下代码给SALES表的P3分区添加了一个P3SUB1子分区

    ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES(‘COMPLETE‘);

    二、删除分区 以下代码删除了P3表分区:

    ALTER TABLE SALES DROP PARTITION P3;

    在以下代码删除了P4SUB1子分区:

    ALTER TABLE SALES DROP SUBPARTITION P4SUB1;

    注意:如果删除的分区是表中唯一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。

    三、截断分区 截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即使只有一个分区时,也可以截断该分区。通过以下代码截断分区:

    ALTER TABLE SALES TRUNCATE PARTITION P2;

    通过以下代码截断子分区:

    ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;

    四、合并分区 合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并:

    ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;

    五、拆分分区 拆分分区将一个分区拆分两个新分区,拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。

    ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE(‘2003-02-01‘,‘YYYY-MM-DD‘)) INTO (PARTITION P21,PARTITION P22);

    六、接合分区(coalesca) 结合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,可以增加散列分区,然后进行接合,值得注意的是,接合分区只能用于散列分区中。通过以下代码进行接合分区:

    ALTER TABLE SALES COALESCA PARTITION;

    七、重命名表分区 以下代码将P21更改为P2

    ALTER TABLE SALES RENAME PARTITION P21 TO P2;

    八、相关查询跨分区查询

    select sum( *) from

    (select count(*) cn from t_table_SS PARTITION (P200709_1)

    union all

    select count(*) cn from t_table_SS PARTITION (P200709_2)

    );

    查询表上有多少分区

    SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME=‘tableName‘

    查询索引信息

    select object_name,object_type,tablespace_name,sum(value)

    from v$segment_statistics

    where statistic_name IN (‘physical reads‘,‘physical write‘,‘logical reads‘)and object_type=‘INDEX‘

    group by object_name,object_type,tablespace_name

    order by 4 desc

    --显示数据库所有分区表的信息:

    select * from DBA_PART_TABLES

    --显示当前用户可访问的所有分区表信息:

    select * from ALL_PART_TABLES

    --显示当前用户所有分区表的信息:

    select * from USER_PART_TABLES

    --显示表分区信息 显示数据库所有分区表的详细分区信息:

    select * from DBA_TAB_PARTITIONS

    --显示当前用户可访问的所有分区表的详细分区信息:

    select * from ALL_TAB_PARTITIONS

    --显示当前用户所有分区表的详细分区信息:

    select * from USER_TAB_PARTITIONS

    --显示子分区信息 显示数据库所有组合分区表的子分区信息:

    select * from DBA_TAB_SUBPARTITIONS

    --显示当前用户可访问的所有组合分区表的子分区信息:

    select * from ALL_TAB_SUBPARTITIONS

    --显示当前用户所有组合分区表的子分区信息:

    select * from USER_TAB_SUBPARTITIONS

    --显示分区列 显示数据库所有分区表的分区列信息:

    select * from DBA_PART_KEY_COLUMNS

    --显示当前用户可访问的所有分区表的分区列信息:

    select * from ALL_PART_KEY_COLUMNS

    --显示当前用户所有分区表的分区列信息:

    select * from USER_PART_KEY_COLUMNS

    --显示子分区列 显示数据库所有分区表的子分区列信息:

    select * from DBA_SUBPART_KEY_COLUMNS

    --显示当前用户可访问的所有分区表的子分区列信息:

    select * from ALL_SUBPART_KEY_COLUMNS

    --显示当前用户所有分区表的子分区列信息:

    select * from USER_SUBPART_KEY_COLUMNS

    --怎样查询出oracle数据库中所有的的分区表

    select * from user_tables a where a.partitioned=‘YES‘

    --删除一个表的数据是

    truncate table table_name;

    --删除分区表一个分区的数据是

    alter table table_name truncate partition p5;

    oracle表空间与分区表

    标签:

    首先,要了解下表空间和区段的关系。1、每个表空间中可以存放一个或多个段;2、每个段是由一个或多个区段组成;3、每个区段是有一个或多个连续的Oracle连续的数据块组成。然后,了解下将表数据分区存储以及将索引分区存储的意义:1、分区表 当一个表的规模很大或者并行操作非常频繁时,可以把这个表划分成若干个分区,每个分区为一个存储数据的段,因其对应的物理磁盘的逻辑结构及位置不同,所以可以提高并行操作的能力。2、索引分区 当在一个大型表上创建索引时,这个索引也会很大,所以也可以像分区表那样分区存储。一个索可以分布在不同的表空间上,但是每个索引分区只能存放在一个表空间中。引入索引分区的目的也是减少输入或输出竞争。追问我想再问一下通过索引和建立分区表,放到不同的表空间是如何提高并行查询效率的???

    追答分区之后,数据库只需要搜索表的相关分区就可以。举个简单的例子:你从100个人里面找一个人方便,还是从10个人里面找一个人方便? 另外,表分区具有独立性,对某个分区的操作不会影响到其它分区,从而在并发操作过程中,每个分区均可以将数据读写速度发挥到极致,这也许和物理存储也有一定的关系,深一点儿的东西我也不太了解了。 你题目给出的分区方式为“范围分区”,是最常用的分区方法。 索引分区的道理是一样的。 看一下这个资料的第二章:http://wenku.baidu.com/view/b8ffa648cf84b9d528ea7aef.html?from=related&hasrec=1

    分区跟表空间的区别-- 分区和表在物理上的存在类似,只是分区表会分成多个分区,每个分区可以分别指定存到不同的表空间索引保存的位置-- create index的语句中指定了tablespace的参数时,索引会存到这个tablespace中,根据你的脚本看,创建的都是global index,分区表的索引会以一个整体存放在某个表空间里。

    0 讨论(0)
提交回复