Теоретический материал

Сайт: Информатикс
Курс: Динамическое программирование
Книга: Теоретический материал
Напечатано:: Гость
Дата: Суббота, 4 Декабрь 2021, 20:11

Нахождение числа сочетаний

Рассмотрим простейшую комбинаторную задачу: сколькими способами можно из данных n$ \ge$ 0 предметов выбрать некоторые k предметов ( 0$ \le$k$ \le$n), если порядок их выбора не важен? Ответом на эту задачу является величина Cnk = $ {n!\over k!(n-k)!}$, называемая числом сочетаний из n элементов по k. Запись n! обозначает произведение 1 . 2 . 3 . ... . n, называемое факториалом числа n, при этом считается, что 0! = 1.

Эту формулу несложно вывести. Расставить n предметов в ряд можно n! способами. Рассмотрим все n! расстановок и будем считать, что первые k предметов в ряду мы выбрали, а оставшиеся n - k предметов -- нет. Тогда каждый способ выбрать k предметов мы посчитали k!(n - k)! раз, поскольку k выбранных предметов можно переставить k! способами, а n - k невыбранных -- (n - k)! способами. Поделив общее количество перестановок на количество повторов каждой выборки, получим число выборок: Cnk = $ {n!\over k!(n-k)!}$.

Наивный метод

Как же вычислить значение Cnk по данным n и k? Воспользуемся выведенной формулой. Функция factorial(n) возвращает факториал числа n, а функция C(n,k) возвращает значение Cnk.

int factorial(int n)
{
    int f=1;
    for(int i=2;i<=n;++i)
        f=f*i;
    return f;
}

int C(int n, int k)
{
    return factorial(n)/factorial(k)/factorial(n-k);
}

Данный алгоритм понятен, очень быстр (его вычислительная сложность O(n), поскольку вычисление значения n! требует n - 1 умножение), использует ограниченный размер дополнительной памяти. Но у него есть существенный недостаток: он будет корректно работать только для небольших значений n и k. Дело в том, что величина n! очень быстро растет с увеличением n, например, значение 13! = 6 227 020 800 превосходит максимальное возможное значение, которое можно записать в 32-разрядном целом числе, а величина

21! = 51 090 942 171 709 440 000

не помещается в 64-разрядном целом числе. Поэтому пользоваться данной функцией можно только для n$ \le$12 при использовании 32-битной арифметики или для n$ \le$20 при использовании 64-битной арифметики. При этом само значение Cnk может быть невелико, но при проведении промежуточных вычислений факториалов может возникнуть переполнение. Например, C3015 = 155117520 можно записать с использованием 32-битной арифметики, однако, значение 30! при этом не поместится и в 64-разрядном целом числе и вычислить значение C3015 таким методом не удастся.

Рекурсивный метод

Проблем с переполнением можно избежать, если воспользоваться для вычисления известной формулой: Cnk = Cn - 1k - 1 + Cn - 1k (при 0 < k < n).

Действительно, выбрать из n предметов k можно Cnk способами. Пометим один из данных n предметов. Тогда все выборки можно разбить на две группы: в которые входит помеченный предмет (их будет Cn - 1k - 1) и не содержащие помеченного предмета (таких выборок будет Cn - 1k).

Добавив к этой формуле краевые значения: Cnn = Cn0 = 1 (выбрать все предметы или не выбрать ни одного предмета можно единственным способом), можно написать рекурсивную функцию вычисления числа сочетаний:

int C(int n, int k)
{
    if (k==0 || k==n)
        return 1;
    else
        return C(n-1,k-1)+C(n-1,k);
}

При таком решении задачи проблем с переполнением не возникнет: если значение конечного ответа не приводит к переполнению, то поскольку при его нахождении мы суммируем меньшие натуральные числа, все промежуточные значения, возвращаемые функцией C(n,k) тоже не будут приводить к переполнению, и такая программа, например, сможет вычислить значение C3015.

Но это решение крайне плохо тем, что работать оно будет очень долго, поскольку функция C(n,k) будет вызываться многократно для одних и тех же значений параметров n и k. Например, если мы вызовем функцию C(30,15), то она вызовет функции C(29,14) и C(29,15). Функция C(29,14) вызовет функции C(28,13) и C(28,14), а C(29,15) вызовет функции C(28,14) и C(28,15). Мы видим, что функция C(28,14) будет вызвана дважды. С увеличением глубины рекурсии количество повторяющихся вызовов функции быстро растет: функция C(27,13) будет вызвана три раза (дважды ее вызовет функция C(28,14) и еще один раз ее вызовет C(28,13) и т. д.

При этом каждая функция C(n,k) может либо вернуть значение 1, либо вернуть сумму результатов двух других рекурсивных вызовов, а, значит, любое значение, которое вернула функция C(n,k) получается сложением в различных комбинациях чисел 1, которыми заканчиваются все рекурсивные вызовы. Значит, при вычислении Cnk инструкция return 1 в приведенной программе будет выполнена ровно Cnk раз, то есть сложность такого рекурсивного алгоритма для вычисления Cnk не меньше, чем само значение Cnk.

Метод динамического программирования

Итак, одна из проблем рекурсивных алгоритмов (и эта проблема возникает весьма часто, не только в рассмотренном примере) -- длительная работа рекурсии за счет повторяющихся вызовов рекурсивной функции для одного и того же набора параметров. Чтобы не тратить машинное время на вычисление значений рекурсивной функции, которые мы уже когда-то вычислили, можно сохранить эти значения в массиве и вместо рекурсивного вызова функции мы будем брать это значение из массива. В задаче вычисления числа сочетаний создадим двумерный массив B и будем в элементе массива B[n][k] хранить величину Cnk. В результате получим следующий массив (по строчкам -- значения n, начиная с 0, по столбцам -- значения k, начиная с 0, каждый элемент массива B[n][k] равен сумме двух элементов: стоящего непосредственно над ним B[n-1][k] и стоящего над ним слева B[n-1][k-1]).

1            
1 1          
1 2 1        
1 3 3 1      
1 4 6 4 1    
1 5 10 10 5 1  
1 6 15 20 15 6 1

Полученная числовая таблица, составленная из значений Cnk, в которой каждый элемент равен сумме двух элементов, стоящих над ним, называется треугольником Паскаля.

Поскольку каждый элемент этого массива равны сумме двух элементов, стоящих в предыдущей строке, то этот массив нужно заполнять по строкам. Соответствующая функция, заполняющая массив и вычисляющая необходимое число сочетаний может быть такой:1

int C(int n, int k)
{
    int B[n+1][n+1];      // Создаем массив B из n+1 строки
    for(int i=0;i<=n;++i) // Заполняем i-ю строку массива
    {
       B[i][0]=1;         // На концах строки стоят единицы
       B[i][i]=1;
       for(int j=1;j<i;++j)
       {   // Заполняем оставшиеся элементы i-й строки
           B[i][j]=B[i-1][j-1]+B[i-1][j];
       }
    }
    return B[n][k];
}

Приведенный алгоритм для вычисления Cnk требует объем памяти O(n2) и такая же его временная сложность (для заполнения одного элемента массива требуется O(1) операций, всего же элементов в массиве O(n2)).

Подобный метод решения, когда одна задача сводится к меньшим подзадачам, вычисленные же ответы для меньших подзадач сохраняются в массиве или иной структуре данных, называется динамическим программированием. В рассмотренной задаче вычисления числа сочетаний использование метода динамического программирования вместо рекурсии позволяет существенно уменьшить время выполнения программы за счет некоторого увеличения объема используемой памяти.

Тем не менее, приведенный алгоритм тоже имеет небольшие недостатки. Мы вычисляем значения всех элементов последней строки, хотя нам необходим только один из них -- B[n][k]. Аналогично, в предпоследней строке нас интересуют только два элемента -- B[n-1][k-1] и B[n-1][k], в строке, стоящей над ней -- три элемента, и т. д., в то время, как мы вычисляем все элементы во всех строках. Кроме того, мы не используем почти половину созданного массива B[n+1][n+1], а именно все элементы, стоящие выше главной диагонали. От этих недостатков можно избавиться, более того, можно уменьшить объем используемой памяти до O(n), идея для построения такого алгоритма будет изложена в разделе «Маршруты на плоскости».

Если же в программе часто возникает необходимость вычисления числа сочетаний Cnk для каких-то ограниченных значений n, то лучше всего создать глобальный массив для хранения всевозможных значений Cnk для нужных нам значений n, заполнить его в начале программы, а затем сразу же брать значение числа сочетаний из этого массива, не вычисляя его каждый раз заново.

Промежуточные итоги

Составим план решения задачи методом динамического программирования.

  1. Записать то, что требуется найти в задаче, как функцию от некоторого набора аргументов (числовых, строковых или еще каких-либо).

  2. Свести решение задачи для данного набора параметров к решению аналогичных подзадач для других наборов параметров (как правило, с меньшими значениями). Если задача несложная, то полезно бывает выписать явное рекуррентное соотношение, задающее значение функции для данного набора параметров.

  3. Задать начальные значения функции, то есть те наборы аргументов, при которых задача тривиальна и можно явно указать значение функции.

  4. Создать массив (или другую структуру данных) для хранения значений функции. Как правило, если функция зависит от одного целочисленного параметра, то используется одномерный массив, для функции от двух целочисленных параметров -- двумерный массив и т. д.

  5. Организовать заполнение массива с начальных значений, определяя очередной элемент массива при помощи выписанного на шаге 2 рекуррентного соотношения или алгоритма.

Далее мы рассмотрим несколько типичных задач, решаемых при помощи динамического программирования.

Маршруты на плоскости

Все задачи этого раздела будут иметь общее начало.

Дана прямоугольная доска размером n×m (n строк и m столбцов). В левом верхнем углу этой доски находится шахматный король, которого необходимо переместить в правый нижний угол.

 

Количество маршрутов

Пусть за один ход королю разрешается передвинуться на одну клетку вниз или вправо. Необходимо определить, сколько существует различных маршрутов, ведущих из левого верхнего в правый нижний угол.

Будем считать, что положение короля задается парой чисел (a, b), где a задает номер строки, а b -- номер столбца. Строки нумеруются сверху вниз от 0 до n - 1, а столбцы -- слева направо от 0 до m - 1. Таким образом, первоначальное положение короля -- клетка (0, 0), а конечное -- клетка (n - 1, m - 1).

Пусть W(a, b) -- количество маршрутов, ведущих в клетку (a, b) из начальной клетки. Запишем рекуррентное соотношение. В клетку (a, b) можно прийти двумя способами: из клетки (a, b - 1), расположенной слева, и из клетки (a - 1, b), расположенной сверху от данной. Поэтому количество маршрутов, ведущих в клетку (a, b), равно сумме количеств маршрутов, ведущих в клетку слева и сверху от нее. Получили рекуррентное соотношение:

 

W(a, b) = W(a, b - 1) + W(a - 1, b).

 

Это соотношение верно при a > 0 и b > 0. Зададим начальные значения: если a = 0, то клетка расположена на верхнем краю доски и прийти в нее можно единственным способом -- двигаясь только влево, поэтому W(0, b) = 1 для всех b. Аналогично, W(a, 0) = 1 для всех a.

Создадим массив W для хранения значений функции, заполним первую строку и первый столбец единицами, а затем заполним все остальные элементы массива. Поскольку каждый элемент равен сумме значений, стоящих слева и сверху, заполнять массив W будем по строкам сверху вниз, а каждую строку -- слева направо.

 

int W[n][m];
int i,j;
for(j=0;j<m;++j)
W[0][j]=1; // Первая строка заполнена единицами
for(i=1;i<n;++i) // i меняется от 1 до n-1
{ // Заполняем строку с номером i
W[i][0]=1; // Элемент в первом столбце равен 1
for(j=1;j<m;++j) // Заполняем остальные элементы строки
W[i][j]=W[i][j-1]+W[i-1][j];
}

В результате такого заполнения получим следующий массив (пример для n = 4, m = 5):

 

1 1 1 1 1
1 2 3 4 5
1 3 6 10 15
1 4 10 20 35

Легко видеть, что в результате получился треугольник Паскаля, записанный в немного другом виде, а именно, значение W[n-1][m-1] равно Cn + m - 2n - 1. Ничего удивительного, ведь выписанное нами рекуррентное соотношение для количества маршрутов очень похоже на ранее выписанное соотношение для числа сочетаний.

Действительно, чтобы попасть из клетки (0, 0) в клетку (n - 1, m - 1) король должен сделать n + m - 2 хода, из которых n - 1 ход вниз и m - 1 ход вправо. Поэтому количество различных маршрутов, ведущих из начальной клетки в конечную равно количеству способов выбрать из общего числа n + m - 2 ходов n - 1 ход вниз, то есть Cn + m - 2n - 1 (и эта же величина равна Cn + m - 2m - 1 -- количеству выборок m - 1 хода вправо).

Поскольку для вычисления очередной строки массива W нам необходима только предыдущая строка, более того, для вычисления одного элемента очередной строки нам необходим только один элемент предыдущей строки, стоящий непосредственно над ним, то мы можем обойтись одномерным массивом вместо двумерного, если будем хранить только одну строку двумерного массива, а именно, ту строку, в которой находится рассматриваемый в данный момент элемент. Получим следующую программу:

 

int W[m];            // Массив элементов одной строки
int i,j;
for(j=0;j<m;++j)
W[j]=1; // Самая первая строка состоит из единиц
for(i=1;i<n;++i)
{ // Теперь записываем в массив W содержимое i-й строки
for(j=1;j<m;++j) // Заполняем все элементы строки,
W[j]=W[j-1]+W[j]; // кроме первого
}

После окончания работы этого алгоритма элемент массива W[m-1] содержит искомое число путей.

Упражнение. Напишите программу, вычисляющую значение Cnk при помощи динамического программирования и использующую одномерный массив из 1 + min(k, n - k) элементов.

Как решить задачу нахождения количества маршрутов, если король может передвигаться на одну клетку вниз, вправо или по диагонали вправо-вниз? Решение будет полностью аналогичным, только реккурентная формула для количества маршрутов изменится:

 

W(a, b) = W(a, b - 1) + W(a - 1, b) + W(a - 1, b - 1).

 

Полученный в результате заполнения по такой формуле массив W будет выглядеть следующим образом:

 

1 1 1 1 1
1 3 5 7 9
1 5 13 25 41
1 7 25 63 129

Упражнение. Решите эту задачу с использованием одномерного массива.

 

Количество маршрутов с препятствиями

Пусть некоторые клетки на доске являются «запретными»: король не может ходить на них. Карта запретных клеток задана при помощи массива Map[n][m]: нулевое значение элемента массива означает, что данная клетка запрещена, единичное значение означает, что в клетку можно ходить. Массив Map считывается программой после задания значений n и m. Король может ходить только вниз или вправо.

Для решения этой задачи придется изменить рекуррентное соотношение с учетом наличия запрещенных клеток. Для запрещенной клетки количество ведущих в нее маршрутов будем считать равным 0. Получим:

 

W(a, b) = $\displaystyle \left\{\vphantom{ W(a-1,b)+W(a,b-1), если Map[a][b]=1,\\ 0, если Map[a][b]=0.}\right.$W(a - 1, b) + W(a, b - 1),еслиMap[a][b] = 1,
0,еслиMap[a][b] = 0.

 

Также надо учесть то, что для клеток верхней строки и левого столбца эта формула некорректна, поскольку для них не существует соседней сверху или слева клетки.

Например, если n = 4, m = 5 и массив Map задан следующим образом:

 

1 1 1 0 1
1 1 1 1 1
1 1 0 1 1
1 1 1 1 1

то искомый массив W будет таким:

 

1 1 1 0 0
1 2 3 3 3
1 3 0 3 6
1 4 4 7 13

Упражнение. Решите эту задачу с использованием одномерного массива. Массив Map при этом считывается построчно и в памяти хранится только последний считанный элемент.

 

Путь максимальной стоимости

Пусть каждой клетке (a, b) доски приписано некоторое число P(a, b) -- стоимость данной клетки. Проходя через клетку, мы получаем сумму, равную ее стоимости. Требуется определить максимально возможную сумму, которую можно собрать по всему маршруту, если разрешается передвигаться только вниз или вправо.

Будем решать данную задачу методом динамического программирования. Пусть S(a, b) -- максимально возможная сумма, которую можно собрать на пути из начальной клетки в клетку (a, b). Поскольку в клетки верхней строки и левого столбца существует единственно возможный маршрут из начальной клетки, то для них величина S(a, b) определяется как сумма стоимостей всех клеток на пути из начальной вершины в данную (а именно, для начальной клетки S(0, 0) = P(0, 0), для клеток левого столбца S(a, 0) = S(a - 1, 0) + P(a, 0), для клеток верхней строки S(0, b) = S(0, b - 1) + P(0, b)). Мы задали граничные значения для функции S(a, b).

Теперь построим рекуррентное соотношение. Пусть (a, b) -- клетка, не лежащая в первой строке или первом столбце, то есть a > 0 и b > 0. Тогда прийти в данную клетку мы можем либо слева, из клетки (a, b - 1), и тогда мы сможем набрать максимальную сумму S(a, b - 1) + P(a, b), либо сверху, из клетки (a - 1, b), тогда мы сможем набрать сумму S(a - 1, b) + P(a, b). Естественно, из этих двух величин необходимо выбрать наибольшую:

 

S(a, b) = P(a, b) + max(S(a, b - 1), S(a - 1, b)).

 

Дальнейшая реализация алгоритма не вызывает затруднений:

 

int i,j;
S[0][0]=P[0][0];
for(j=1;j<m;++j)
S[0][j]=S[0][j-1]+P[0][j]; // Заполняем первую строку
for(i=1;i<n;++i)
{ // Заполняем i-ю строку
S[i][0]=S[i-1][0]+P[i][0]; // Заполняем 1-й столбец
for(j=1;j<m;++j) // Заполняем остальные столбцы
if ( S[i-1][j] > S[i][j-1] ) // Выбираем максимум
S[i][j]=P[i][j]+S[i-1][j]; // из S[i-1][j] и S[i][j-1]
else // и записываем в S[i][j]
S[i][j]=P[i][j]+S[i][j-1]; // с добавлением P[i][j]
}

Рассмотрим пример доски при n = 4, m = 5. Для удобства в одной таблице укажем значения обоих массивов: до дробной черты указана стоимость данной клетки, то есть значение P[i][j], после черты -- максимальная стоимость маршрута, ведущего в данную клетку, то есть величина S[i][j]:

 

1 / 1 3 / 4 5 / 9 0 / 9 3 / 12
0 / 1 1 / 5 2 / 11 4 / 15 1 / 16
2 / 3 4 / 9 3 / 14 3 / 18 2 / 20
3 / 6 1 / 10 2 / 16 4 / 22 3 / 25

Итак, максимальная стоимость пути из левого верхнего в правый нижний угол в этом примере равна 25.

Как и все предыдущие, данную задачу можно решить с использованием одномерного массива S.

Как изменить данный алгоритм, чтобы он находил не только максимально возможную стоимость пути, но и сам путь? Заведем массив Prev[n][m], в котором для каждой клетки будем хранить ее предшественника в маршруте максимальной стоимости, ведущем в данную клетку: если мы пришли в клетку слева, то запишем в соответствующий элемент массива Prev значение 1, а если сверху -- значение 2. Чтобы не путаться, обозначим данные значения константами:

const L=1; // Left
const U=2; // Upper

В начальную клетку запишем 0, поскольку у начальной клетки нет предшественника. В остальные клетки первой строки запишем L, а в клетки первого столбца запишем U. Остальные элементы массива Prev будем заполнять одновременно с массивом S:

 

        if ( S[i-1][j] > S[i][j-1] )
{ // В клетку (i,j) приходим сверху из (i-1,j)
S[i][j]=P[i][j]+S[i-1][j];
Prev[i][j]=U;
}
else
{ // В клетку (i,j) приходим слева из (i,j-1)
S[i][j]=P[i][j]+S[i][j-1];
Prev[i][j]=L;
}

В результате, в приведенном выше примере мы получим следующий массив (значения массива Prev мы запишем в той же таблице после второй черты дроби, то есть в каждой клетке теперь записаны значения P[i][j] / S[i][j] / Prev[i][j]). Клетки, через которые проходит маршрут максимальной стоимости, выделены жирным шрифтом:

1 / 1 / 0 3 / 4 / L 5 / 9 / L 0 / 9 / L 3 / 12 / L
0 / 1 / U 1 / 5 / U 2 / 11 / U 4 / 15 / L 1 / 16 / L
2 / 3 / U 4 / 9 / U 3 / 14 / U 3 / 18 / U 2 / 20 / L
3 / 6 / U 1 / 10 / U 2 / 16 / U 4 / 22 / U 3 / 25 / L

После заполнения всех массивов мы можем восстановить путь, пройдя по нему с конца при помощи цикла, начав с конечной клетки и передвигаясь влево или вверх в зависимости от значения соответствующего элемента массива Prev:

 

i=n-1;                   // (i,j) - координаты текущей точки
j=m-1; // начинаем с конечной клетки
while (Prev[i][j]!=0) // проверка, не дошли ли до начальной
{
if(Prev[i][j]==L)
j=j-1; // передвигаемся влево
else
i=i-1; // передвигаемся вверх
}

При этом мы получим путь, записанный в обратном порядке. Несложную задачу обращения этого пути и вывода его на экран оставим для самостоятельного решения.

Можно обойтись и без дополнительного массива предшественников Prev. Если имеется заполненный массив S, то предшественника каждой клетки мы можем легко определить, сравнив значения элемента массива S для ее левого и правого соседа и выбрав ту клетку, для которой это значение наибольшее.

i=n-1;
j=m-1;
while ( i>0 && j>0 )
{
if ( S[i][j-1] > S[i-1][j] )
j=j-1;
else
i=i-1;
}

Этот алгоритм заканчивается, когда мы выйдем на левый или верхний край доски (цикл while продолжается, пока i>0 и j>0, то есть клетка не лежит на верхнем или левом краю доски), после чего нужно будет двигаться по краю влево или вверх, пока не дойдем до начальной клетки. Это можно реализовать двумя циклами (при этом из этих двух циклов выполняться будет только один, поскольку после выполнения предыдущего фрагмента программы значение одной из переменных i или j будет равно 0):

 

while(i>0)
{ // Движение вверх, пока возможно
i=i-1;
}
while(j>0)
{ // Движение влево, пока возможно
j=j-1;
}

Таким образом, если мы хотим восстановить путь наибольшей стоимости, необходимо либо полностью сохранять в памяти значения всего массива S, либо хранить в памяти предшественника для каждой клетки. Для восстановления пути потребуется память порядка O(nm). Сложность алгоритма нахождения пути максимальной стоимости также имеет порядок O(nm) и, очевидно, не может быть уменьшена, поскольку для решения задачи необходимо использование каждого из nm элементов данного массива P.

Числа Каталана

Рассмотрим произвольное арифметическое выражение. Теперь сотрем в этом выражении всё кроме скобок. Получившуюся последовательность из скобок будем называть «правильной скобочной последовательностью». Любая правильная скобочная последовательность состоит из равного числа открывающихся и закрывающихся скобок. Но этого условия недостаточно: например, скобочная последовательность «(())» является правильной, а последовательность «)()(» -- нет.

Можно дать и точное определение правильной скобочной последовательности.

  1. Пустая последовательность (то есть не содержащая ни одной скобки) является правильной скобочной последовательностью.
  2. Если «A» -- правильная скобочная последовательность, то «(A)» (последовательность A, взятая в скобки) -- правильная скобочная последовательность.
  3. Если «A» и «B» -- правильные скобочные последовательности, то «AB» (подряд записанные последовательности A и B) -- правильная скобочная последовательность.

Обозначим количество правильных скобочных последовательностей длины 2n (то есть содержащих n открывающихся и n закрывающихся скобок) через Cn и решим задачу нахождения Cn по заданной величине n.

Для небольших n значения Cn несложно вычислить полным перебором. C0 = 1 (правильная скобочная последовательность длины 0 ровно одна -- пустая), C1 = 1 (последовательность «()»), C2 = 2 (последовательности «(())» и «()()»), C3 = 5 («((()))», «(()())», «(())()», «()(())», «()()()»).

Запишем рекуррентную формулу для Cn. Пусть X -- произвольная правильная скобочная последовательность длины 2n. Она начинается с открывающейся скобки. Найдем парную ей закрывающуюся скобку и представим последовательность X в виде:

X = (A)B,

где A и B -- тоже правильные скобочные последовательности. Если длина последовательности A равна 2k, то последовательность A можно составить Ck способами. Тогда длина последовательности B равна 2(n - k - 1) и последовательность B можно составить Cn - k - 1 способами. Комбинация любого способа составить последовательность A с любым способом составить последовательность B даст новую последовательность X, а величина k может меняться от 0 до n - 1. Получили рекуррентное соотношение:

Cn = C0Cn - 1 + C1Cn - 2 + C2Cn - 3 +...+ Cn - 2C1 + Cn - 1C0.

Напишем функцию, вычисляющую значение Cn по данному n:

int Catalan(int n) 
{
  int C[n+1];
// Создаем массив для хранения C[m]
  C[0]=1;
  for (int m=1; m<=n; ++m)   // Вычисляем C[m] для m=1..n
  {
    C[m]=0;
    for (int k=0; k<m; ++k)
      C[m]+=C[k]*C[m-1-k];
  }
  return C[n];
}

Мы назвали функцию Catalan, поскольку значения Cn называются числами Каталана в честь бельгийского математика XIX века Евгения Шарля Каталана. Начало ряда чисел Каталана выглядит следующим образом:

n 0 1 2 3 4 5 6 7 8 9 10
Cn 1 1 2 5 14 42 132 429 1430 4862 16796

Для чисел Каталана хорошо известна и нерекуррентная формула:

Cn = $\displaystyle {C_{2n}^n\over n+1}$ = $\displaystyle {(2n)!\over n!(n+1)!}$.

Более подробно про правильные скобочные последовательности а также элементарное доказательство данной формулы можно прочесть в [1, 2.6-7].