Использование нескольких индексов для выполнения запроса

Источник: ln

В этом выпуске мы рассмотрим некоторые особенности использования индексов в Oracle.

Максимальное количество индексов для запроса

Когда в запросе есть два и более условия с проверкой на равенство, можно использовать несколько индексов. Oracle будет "объединять" ( сливать , merge) индексы во время выполнения, возвращая строки, которые найдены по обоим индексам. Например, при выполнении запроса:

SELECT    ename
FROM      emp
WHERE     deptno=20
AND       job='manager'

может быть выполнено слияние следующих индексов:

неуникального индекса по столбцу job
неуникального индекса по столбцу deptno

А как реально сервер осуществляет слияние индексов? Что лучше: конкатенированный индекс по столбцам job и deptno или отдельные индексы по столбцам job и deptno, которые могут быть объединены?

Правда ли, что Oracle использует для запроса не более 5 индексов? Сколько максимум индексов по таблице можно создать?

Ответ Тома Кайта

Индексы объединяются именно так, как вы и подумали. Условие deptno=20 будет генерировать один список идентификаторов строк-кандидатов, а условие job='manager' - другой. Эти списки будут объединяться, и фактически выбраны из таблицы будут только строки, входящие в оба списка.

А вот ответ на вопрос, что лучше (как всегда) зависит от многих обстоятельств. Бывают случаи, благоприятные для обоих вариантов. В рассмотренном выше примере, конкатенированный индекс по deptno, job, скорее всего, будет лучше (работы меньше). Однако, если в таблице EMP есть 50 столбцов, а в условии могут упоминаться любые ДВА из них? Вы хотите создавать индекс для каждого сочетания (я - нет)?

При работе с индексами на основе битовых карт (bitmap indexes), использовать конкатенированный индекс почти никогда нет смысла. Практически всегда индексируются отдельные столбцы.

Что касается ограничения "5", - мы будем использовать столько индексов, сколько нужно. Например:

ops$tkyte@ORA817.US.ORACLE.COM> create table t ( a int, b int, c int, d int, e 
int, f int, g int, h int, i int );

Table created.

ops$tkyte@ORA817.US.ORACLE.COM> create bitmap index t_a on t(a);

Index created.

ops$tkyte@ORA817.US.ORACLE.COM> create bitmap index t_b on t(b);

Index created.

ops$tkyte@ORA817.US.ORACLE.COM> create bitmap index t_c on t(c);

Index created.

ops$tkyte@ORA817.US.ORACLE.COM> create bitmap index t_d on t(d);

Index created.

ops$tkyte@ORA817.US.ORACLE.COM> create bitmap index t_e on t(e);

Index created.

ops$tkyte@ORA817.US.ORACLE.COM> create bitmap index t_f on t(f);

Index created.

ops$tkyte@ORA817.US.ORACLE.COM> create bitmap index t_g on t(g);

Index created.

ops$tkyte@ORA817.US.ORACLE.COM> create bitmap index t_h on t(h);

Index created.

ops$tkyte@ORA817.US.ORACLE.COM> create bitmap index t_i on t(i);

Index created.

ops$tkyte@ORA817.US.ORACLE.COM> exec dbms_stats.set_table_stats( user, 'T', 
numrows=>10000000, numblks => 10000000 );

PL/SQL procedure successfully completed.

ops$tkyte@ORA817.US.ORACLE.COM> set autotrace on explain
ops$tkyte@ORA817.US.ORACLE.COM> select count(*)
  2    from t
  3   where a = 1
  4     and b = 2
  5     and c = 3
  6     and d = 4
  7     and e = 5
  8     and f = 6
  9     and g = 7
 10     and h = 8
 11     and i = 9
 12  /

  COUNT(*)
----------
         0

Execution Plan
----------------------------------------------------------
   0      SELECT STATEMENT Optimizer=CHOOSE (Cost=10 Card=1 Bytes=100)
   1    0   SORT (AGGREGATE)
   2    1     BITMAP CONVERSION (COUNT)
   3    2       BITMAP AND
   4    3         BITMAP INDEX (SINGLE VALUE) OF 'T_A'
   5    3         BITMAP INDEX (SINGLE VALUE) OF 'T_B'
   6    3         BITMAP INDEX (SINGLE VALUE) OF 'T_C'
   7    3         BITMAP INDEX (SINGLE VALUE) OF 'T_D'
   8    3         BITMAP INDEX (SINGLE VALUE) OF 'T_E'
   9    3         BITMAP INDEX (SINGLE VALUE) OF 'T_F'
  10    3         BITMAP INDEX (SINGLE VALUE) OF 'T_G'
  11    3         BITMAP INDEX (SINGLE VALUE) OF 'T_H'
  12    3         BITMAP INDEX (SINGLE VALUE) OF 'T_I'

Даже если используются обычные индексы, можно будет их соединить:

ops$tkyte@ORA817.US.ORACLE.COM> select /*+ index_join( t ) */ count(*)
  2    from t
  3   where a = 1
  4     and b = 2
  5     and c = 3
  6     and d = 4
  7     and e = 5
  8     and f = 6
  9     and g = 7
 10     and h = 8
 11     and i = 9
 12  /

  COUNT(*)
----------
         0

Execution Plan
----------------------------------------------------------
   0      SELECT STATEMENT Optimizer=CHOOSE (Cost=32 Card=1 Bytes=100)
   1    0   SORT (AGGREGATE)
   2    1     VIEW OF 'index$_join$_001' (Cost=32 Card=1 Bytes=100)
   3    2       HASH JOIN
   4    3         HASH JOIN
   5    4           HASH JOIN
   6    5             HASH JOIN
   7    6               HASH JOIN
   8    7                 HASH JOIN
   9    8                   HASH JOIN
  10    9                     HASH JOIN
  11   10                       INDEX (RANGE SCAN) OF 'T_A' (NON-UNIQUE) 
(Cost=11 Card=1 Bytes=100)
  12   10                       INDEX (RANGE SCAN) OF 'T_B' (NON-UNIQUE) 
(Cost=11 Card=1 Bytes=100)
  13    9                     INDEX (RANGE SCAN) OF 'T_C' (NON-UNIQUE) (Cost=11 
Card=1 Bytes=100)
  14    8                   INDEX (RANGE SCAN) OF 'T_D' (NON-UNIQUE) (Cost=11 
Card=1 Bytes=100)
  15    7                 INDEX (RANGE SCAN) OF 'T_E' (NON-UNIQUE) (Cost=11 
Card=1 Bytes=100)
  16    6               INDEX (RANGE SCAN) OF 'T_F' (NON-UNIQUE) (Cost=11 Card=1 
Bytes=100)
  17    5             INDEX (RANGE SCAN) OF 'T_G' (NON-UNIQUE) (Cost=11 Card=1 
Bytes=100)
  18    4           INDEX (RANGE SCAN) OF 'T_H' (NON-UNIQUE) (Cost=11 Card=1 
Bytes=100)
  19    3         INDEX (RANGE SCAN) OF 'T_I' (NON-UNIQUE) (Cost=11 Card=1 
Bytes=100)

Использование нескольких индексов...

Я тут борюсь с использованием нескольких индексов для Index Join... У меня есть два индекса на основе b-дерева по таблице, и я хочу выбирать данные путем соединения этих двух индексов, а не полным просмотром таблицы. Эти два индекса содержат все столбцы, которые выбираются в запросе. Я пытался использовать подсказку /*+ INDEX_JOIN(TAB1 IND1 IND2) */, но она не работает. Не могли бы вы объяснить, как использовать Index Join для индексов на основе B-деревьев? Какие параметры инициализации надо установить, чтобы эта возможность использовалась?

Ответ Тома Кайта

Примеры - всегда нужны примеры того, что именно пытались делать, чтобы объяснить, почему что-то произошло или не произошло...

Причин может быть множество. Среди наиболее вероятных - следующие:

вы тестировали без статистической информации;
вы тестировали на слишком маленьком наборе данных;
индексы созданы по столбцам, допускающим неопределенные значения, и условий не задали;
полный просмотр был ЛУЧШЕ, чем соединение индексов, и мы его проигнорировали (подсказки - это не директивы!)

ops$tkyte@ORA817DEV.US.ORACLE.COM> @desc big_table

Datatypes for Table big_table
                               Data                 Data
Column Name                    Type                 Length      Nullable
------------------------------ -------------------- ----------- --------
OWNER                          VARCHAR2             30          not null
OBJECT_NAME                    VARCHAR2             30          not null
SUBOBJECT_NAME                 VARCHAR2             30          null
OBJECT_ID                      NUMBER                           not null
DATA_OBJECT_ID                 NUMBER                           null
OBJECT_TYPE                    VARCHAR2             18          null
CREATED                        DATE                 7           not null
LAST_DDL_TIME                  DATE                 7           not null
TIMESTAMP                      VARCHAR2             19          null
STATUS                         VARCHAR2             7           null
TEMPORARY                      VARCHAR2             1           null
GENERATED                      VARCHAR2             1           null
SECONDARY                      VARCHAR2             1           null

Indexes on big_table

Index                          Is
Name                           Unique COLUMNS
------------------------------ ------ --------------------------------
BIG_TABLE_IDX1                 No     OBJECT_NAME
BIG_TABLE_IDX2                 No     OBJECT_ID

Для этой таблицы из 1000000 строк я запросто добиваюсь соединения индексов:

ops$tkyte@ORA817DEV.US.ORACLE.COM> select /*+ index_join( big_table 
big_table_idx1 big_table_idx2 ) */ object_name, object_id
  2  from big_table
  3  where object_name like 'ABCDEF%'
  4  and object_id between 1000 and 1500
  5  /

no rows selected

Execution Plan
----------------------------------------------------------
   0      SELECT STATEMENT Optimizer=CHOOSE (Cost=83 Card=138 Bytes=4140)
   1    0   VIEW OF 'index$_join$_001' (Cost=83 Card=138 Bytes=4140)
   2    1     HASH JOIN
   3    2       INDEX (RANGE SCAN) OF 'BIG_TABLE_IDX2' (NON-UNIQUE) (Cost=81 
Card=138 Bytes=4140)
   4    2       INDEX (RANGE SCAN) OF 'BIG_TABLE_IDX1' (NON-UNIQUE) (Cost=81 
Card=138 Bytes=4140)

Statistics
----------------------------------------------------------
          0  recursive calls
          0  db block gets
         73  consistent gets
          0  physical reads
          0  redo size
        272  bytes sent via SQL*Net to client
        319  bytes received via SQL*Net from client
          1  SQL*Net roundtrips to/from client
          0  sorts (memory)
          0  sorts (disk)
          0  rows processed

Мне пришлось задать подсказку, поскольку это ОШИБОЧНЫЙ план:

ops$tkyte@ORA817DEV.US.ORACLE.COM> select object_name, object_id
  2  from big_table
  3  where object_name like 'ABCDEF%'
  4  and object_id between 1000 and 1500
  5  /

no rows selected

Execution Plan
----------------------------------------------------------
   0      SELECT STATEMENT Optimizer=CHOOSE (Cost=431 Card=138 Bytes=4140)
   1    0   TABLE ACCESS (BY INDEX ROWID) OF 'BIG_TABLE' (Cost=431 Card=138 
Bytes=4140)
   2    1     INDEX (RANGE SCAN) OF 'BIG_TABLE_IDX1' (NON-UNIQUE) (Cost=52 
Card=138)

Statistics
----------------------------------------------------------
          0  recursive calls
          0  db block gets
          3  consistent gets
          0  physical reads
          0  redo size
        272  bytes sent via SQL*Net to client
        319  bytes received via SQL*Net from client
          1  SQL*Net roundtrips to/from client
          0  sorts (memory)
          0  sorts (disk)
          0  rows processed

Никаких параметров инициализации задавать не нужно.

Подсказка index_join приводит к использованию только одного из индексов...

У меня есть запрос с подсказкой index_join:

SELECT /*+index_join(ho idx1 idx2)*/
sum( nvl(mw,0) )
FROM ho
WHERE fko = :b4 AND
fks = :b3 AND
hdate >= :b2 AND
hdate <  :b1

Получаемый в результате план выполнения на oracle 9.2.0.3.0 (AIX - 64BIT) показывает, что выполняется index_join, но используется только один из указанных индексов, и соединяется он с неким третим индексом. Проблема в том, что этот третий индекс не секционирован, поэтому запрос работает дольше.

/     Rows Row Source Operation
/--------- ---------------------------------------------------
/      345 SORT AGGREGATE (cr=6409065 pr=6730699 pw=340953 time=7952.32)
/   252288 .FILTER (cr=6409065 pr=6730699 pw=340953 time=7951.67)
/   252288 ..VIEW (cr=6409065 pr=6730699 pw=340953 time=7951.20)
/   252288 ...HASH JOIN (cr=6409065 pr=6730699 pw=340953 time=7950.17)
/154842493 ....PARTITION RANGE ITERATOR PARTITION: KEY KEY (cr=264615 pr=264615 pw=0 time=534.27)
/154842493 .....INDEX RANGE SCAN idx2 PARTITION: KEY KEY (object id 42026 ) (cr=264615 pr=264615 pw=0 time=316.62)
/  5228609 ....INDEX FAST FULL SCAN idx3 (object id 36664 ) (cr=6144450 pr=6125131 pw=0 time=6704.00)

Меня интересует, почему Oracle выбрал только один из двух индексов, указанных в подсказке index_join?

Вот определения таблицы, представления и индекса:

CREATE TABLE ho_t
    (hid           NUMBER(9,0) NOT NULL,
    hdate          DATE NOT NULL,
    fko            NUMBER(9,0) NOT NULL,
    fks            NUMBER(9,0) NOT NULL,
    df             NUMBER(1,0) NOT NULL,
    mw             NUMBER(13,3)
--... еще 25 столбцов
)
  PARTITION BY RANGE (hdate)
  (
  PARTITION p_2_2 VALUES LESS THAN (TO_DATE(' 2000-07-01 00:00:00', 'SYYYY-MM-DD 
HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
--... еще 15 секций
  )
/
CREATE OR REPLACE VIEW ho (
   hid,
   hdate,
   fko,
   fks,
   df,
   mw
--.. еще 25 столбцов
 )
AS
select hid, hdate, fko, fks, df, mw
--... еще 25 столбцов
   from   ho_t
/
CREATE UNIQUE INDEX idx1 ON ho_t
  (
    hdate         ASC,
    fks           ASC,
    df            ASC,
    fko           ASC
  )
LOCAL (
  PARTITION p_2_2
--... еще 15 секций
)
/
CREATE INDEX idx2 ON ho_t
  (
    hdate          ASC,
    fko            ASC,
    mw        
  )
LOCAL (
  PARTITION p_2_2
--... еще 15 секций
)
/
CREATE INDEX idx3 ON ho_t
  (
    fko           ASC,
    fks           ASC
  )
/
ALTER TABLE ho_t
ADD CONSTRAINT pk_ho_t PRIMARY KEY (hid)
USING INDEX
/
ALTER TABLE ho_t
ADD CONSTRAINT fk_h FOREIGN KEY (fko)
REFERENCES R.s (oi) ON DELETE SET NULL
/

Ответ Тома Кайта

Помогите мне "поломать" следующий пример:

drop table ho_t;
                                                                      
CREATE TABLE ho_t
    (hid           NUMBER(9,0) NOT NULL,
    hdate          DATE NOT NULL,
    fko            NUMBER(9,0) NOT NULL,
    fks            NUMBER(9,0) NOT NULL,
    df             NUMBER(1,0) NOT NULL,
    mw             NUMBER(13,3)
)
partition by range(hdate)
(
partition p1 values less than
(TO_DATE(' 2000-07-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 
'NLS_CALENDAR=GREGORIAN')),
partition p2 values less than
(TO_DATE(' 2001-07-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 
'NLS_CALENDAR=GREGORIAN'))
)
/
                                                                      
create or replace view ho
as
select * from ho_t
/
                                                                      
CREATE UNIQUE INDEX idx1 ON ho_t
  (
    hdate         ASC,
    fks           ASC,
    df            ASC,
    fko           ASC
  )
  local
/
                                                                      
CREATE INDEX idx2 ON ho_t
  (
    hdate          ASC,
    fko            ASC,
    mw
  )
  local
/
                                                                      
CREATE INDEX idx3 ON ho_t
  (
    fko           ASC,
    fks           ASC
  )
/
                                                                      
variable b1 varchar2(25);
variable b2 varchar2(25);
variable b3 varchar2(25);
variable b4 varchar2(25);
set linesize 121
                                                                      
delete from plan_table;
explain plan for
SELECT /*+index_join(ho idx1 idx2)*/
sum( nvl(mw,0) )
FROM ho
WHERE fko = to_number(:b4) AND
fks = to_number(:b3) AND
hdate >= to_date(:b2) AND
hdate <  to_date(:b1)
/
select * from table(dbms_xplan.display);

Комментарий читателя от 6 мая 2004 года

Чтобы "поломать" ваш сценарий, мне пришлось бы скопировать данные из исходной таблицы (более 11 миллионов строк) и посмотреть, будет ли ваша таблица вести себя так же, как и исходная.

Я надеялся, что вы уже сталкивались с этой проблемой, например, с недокументированными ограничениями подсказки index_join, вот почему я и послал определения таблицы, индексов и представления...

Ответ Тома Кайта

Нет, используйте пакет dbms_stats для установки статистической информации для таблицы и т.п., чтобы "мой" план стал "вашим".

Если соединение индексов можно использовать, оно должно было использоваться. Должно быть нечто, что сделает этот тестовый пример "более походим на реальный", чтобы получить ваш результат.