Введение в SQLite
Автор перевода: Ожегов Денис
Для кого эта статья
Данная статья предназначается PHP программистам, проявившим интерес к расширению SQLite. Статья представит читателю функциональность, предлагаемую расширением PHP SQLite, а также рассмотрит преимущества SQLite в сравнении с другими БД. Предполагается, что читатель знаком с основами PHP и SQL. Некоторый опыт работы с MySQL или PostgreSQL , будет способствовать лучшему пониманию того, о чём пойдёт речь.
Введение
В последнее время, вы, возможно, слышали о новом расширении для PHP: SQLite. Есть много причин, по которым SQLite может показаться лучшим достижением с тех пор, как научились резать хлеб. SQLite предлагает добротный SQL интерфейс к нерелятивистской базе данных и создаёт элегантную альтернативу громоздким интерфейсам других баз данных без потери функциональности или скорости, как можно было бы ожидать. Мы рассмотрим в статье это удивительное расширение и, будем надеяться, нам удастся подтвердить те преимущества, о которых, возможно, вы наслышаны.
Что такое SQLite?
SQLite – это встраиваемая библиотека в которой реализовано многое из стандарта SQL 92. Её притязанием на известность является как собственно сам движок базы, так и её интерфейс (точнее его движок) в пределах одной библиотеки, а также возможность хранить все данные в одном файле. Я отношу позицию функциональности SQLite где-то между MySQL и PostgreSQL. Однако, на практике, SQLite не редко оказывается в 2-3 раза (и даже больше) быстрее. Такое возможно благодаря высокоупорядоченной внутренней архитектуре и устранению необходимости в соединениях типа «сервер-клиент» и «клиент-сервер».
Всё это, собранное в один пакет, лишь немногим больше по размеру клиентской части библиотеки MySQL, является впечатляющим достижением для полноценной базы данных. Используя высоко эффективную инфраструктуру, SQLite может работать в крошечном объёме выделяемой для неё памяти, гораздо меньшем, чем в любых других системах БД. Это делает SQLite очень удобным инструментом с возможностью использования практически в любых задачах возлагаемых на базу данных.
Что мне проку от SQLite?
Помимо скорости и эффективности у SQLite есть ряд других преимуществ, которые делают её идеальным решением для многих задач. Так как база данных SQLite по сути своей – обычные файлы, нет ни какой необходимости в дополнительных средствах администрирования требующих много времени на создание сложной структуры прав доступа для защиты пользовательских баз данных. Всё это уже автоматически поддерживается организацией прав доступа в самой файловой системе, это также подразумевает (в области ограничения пространства), что не требуется ни каких специальных правил для отслеживания заполнения дискового пространства пользователем. Преимущество для пользователей в том, что есть возможность создать такое количество баз данных, какое они себе пожелают плюс абсолютный контроль над всеми этими базами данных.
Факт, что база данных – это единственный файл, делает её легко переносимой. SQLite к тому же, устраняет необходимость в запуске дополнительных служебных процессов (daemons), которые могли бы «отъедать» значительное количество памяти и других ресурсов, даже в случае умеренного использования базы данных.
Расширение SQLite
В качестве новейшего расширения БД, SQLite посчастливилось быть свободным от кода для обратной совместимости, в противоположность более старым расширениям, таким как MySQL , которые обязаны поддерживать устаревшую функциональность по причинам обратной совместимости. Это также позволяет новому расширению использовать самые новейшие разработки в PHP для достижения самого высокого уровня исполнения и функциональности. Разработчики облегчили задачу пользователям, создав расширение лёгким для перехода к нему от других систем БД, оставив интерфейс похожим на те, что уже были реализованы в PHP.
SQLite также поддерживает гибкий механизм для передачи ресурсов базы данных в процедурные интерфейсы, делая это одинаково лёгким для перехода из MySQL, где ресурс передаётся последним, и PostgreSQL, где он передаётся первым.
SQLite также отличает мощный объектно-ориентированный интерфейс, который может быть использован для эффективного извлечения данных из базы, избавляя вас от необходимости выполнения вашей собственной оболочки для процедурного интерфейса. Как показано в примере ниже, объектно-ориентированный интерфейс также позволяет вам избежать передачи всех ресурсов кучей.
<?php
// создаём новую базу (OO интерфейс) $db = new sqlite_db("db.sqlite");
// создаём таблицу foo и вставляем что-нибудь для примера $db->query("BEGIN;
CREATE TABLE foo(id INTEGER PRIMARY KEY, name CHAR(255));
INSERT INTO foo (name) VALUES('Ilia');
INSERT INTO foo (name) VALUES('Ilia2');
INSERT INTO foo (name) VALUES('Ilia3');
COMMIT;");
// выполняем запрос $result = $db->query("SELECT * FROM foo"); // проходим в цикле по ячейкам while ($result->hasMore()) {
// получаем текущую ячейку
$row = $result->current();
print_r($row); // переходим к следующей ячейке
$result->next();
}
// нет особой необходимости, так как PHP сам разорвёт соединение unset($db);
?>
Установка SQLite
В PHP 5.0 установка SQLite имеет свою особенность, так как и расширение и библиотека связаны вместе, поэтому всё, что вам необходимо сделать – это добавить –with-sqlite в строке конфигурирования. Я бы ещё порекомендовал установить SQLite, но только в случае если речь об откомпилированном бинарном файле, что позволит вам открывать базу и управлять ею без использования PHP. Это весьма полезно для отладки и выполнения различных одновременных команд, а также полезно для тестирования кода запросов. В будущем, довольно часто вы сможете обнаружить, что связанная библиотека SQLite немного "устарела", поэтому связка вашего PHP с внешней библиотекой позволит вам извлечь выгоду из последних исправлений и нововведений SQLite. Это также позволит вам в будущем обновлять вашу SQLite без перекомпиляции PHP.
Чтобы собрать расширение SQLite в качестве внешней библиотеки, просто используйте –with-sqlite=/path/to/lib/.
Мне также следует упомянуть, что расширение SQLite проходит исчерпывающую серию тестов, как для объектно-ориентированного, так и для процедурного интерфейсов. Тестируются каждая отдельная функция, и каждый метод поддерживаемый SQLite. Это великолепный источник примеров не только того, как работает каждый метод и каждая функция SQLite, но и ожидаемого вывода, позволяющего вам видеть конечный результат каждой операции.
Использование SQLite
Процедурный интерфейс к SQLite почти такой же, как у MySQL и других расширений БД. По большей части переход к SQLite потребует только изменить mysql/pq/etc… префикс функции на sqlite.
<?php // создаём новую базу (процедурный интерфейс) $db = sqlite_open("db.sqlite");
// создаём таблицу foo sqlite_query($db, "CREATE TABLE foo (id INTEGER PRIMARY KEY, name CHAR(255))");
// добавляем что-нибудь для примера sqlite_query($db, "INSERT INTO foo (name) VALUES ('Ilia')"); sqlite_query($db, "INSERT INTO foo (name) VALUES ('Ilia2')"); sqlite_query($db, "INSERT INTO foo (name) VALUES ('Ilia3')");
// выполняем запрос $result = sqlite_query($db, "SELECT * FROM foo"); // проходим в цикле выборкой по ячейкам while ($row = sqlite_fetch_array($result)) {
print_r($row);
/* каждый результат будет выглядеть примерно так
Array
(
[0] => 1
[id] => 1
[1] => Ilia
[name] => Ilia
)
*/ }
// закрываем соединение с базой sqlite_close($db);
?>
Собственно значительные отличия между SQLite и другими базами данных находятся в самом движке. В отличие от других БД в SQLite нет привязки к типам; все данные сохраняются как строки оканчивающиеся символом NULL, что лучше, чем двоичное представление данных в столбцах специального типа. По причине совместимости SQLite пока поддерживает тип спецификации в конструкциях CREATE TABLE, например, такой как INT, CHAR, FLOAT, TEXT и тому подобные, но реально их не использует. Внутри базы, SQLite только делает различие между строковыми и целочисленными данными во время сортировки. Поэтому, если вы не собираетесь сортировать данные, вы можете обойтись без указания специального типа полей при создании таблиц в SQLite.
"Безтиповая природа" SQLite делает сортировку и сопоставление данных в некотором роде медленнее, так как каждый раз SQLite будет вынуждена определять тип данных и применять либо строковый механизм сортировки/сравнения либо числовой. SQL таблицы часто требуют автоматически присваиваемый ключ для быстрого доступа к ячейкам, подразумевая возврат ссылки на последнюю добавленную ячейку. Для SQLite этот синтаксис, мягко говоря, бесполезен. Чтобы создать такую таблицу, вам понадобится объявить поле как INTEGER PRIMARY KEY, что более удобно чем указание специализированного типа или присваивание дополнительных свойств, которые указывают на то, что поле является автоинкрементным.
Связанные запросы
Как вы можете ожидать, SQLite несёт в себе много новых особенностей улучшающих исполнение и расширяющих функциональность. Одна из таких особенностей – возможность выполнять связанные запросы, которые подразумевают выполнение множественных запросов через функцию выполнения одного запроса. Это снижает количество задействованных функций PHP и таким образом увеличивает скорость работы скрипта. А также позволяет вам легко группировать блоки запросов внутри транзакций, улучшая выполнение в дальнейшем. Такая возможность может быть значительным фактором во время выполнения множественных обращений на запись в базу. Однако существует несколько пикантных особенностей, о которых не следует забывать.
Если какой-либо запрос в SQLite использует что-то введённое пользователем напрямую, вам следует предпринять дополнительные меры предосторожности для проверки такого ввода, чтобы пресечь нежелательный запрос. В противоположность MySQL, где такое может повлечь за собой лишь недоразумение при запросе к БД и выдать ошибку, в SQLite это позволит атакующему выполнить какой-нибудь запрос на вашем сервере с возможными плачевными последствиями. Если вы добавляете записи через блок запросов и хотели бы возвращать идентификатор, то sqlite_last_insert_rowid() хорошо справится с такой задачей, но вернёт идентификатор только последней записи. С другой стороны, при попытке определить какое количество ячеек было изменено, используя sqlite_changes(), мы получим результат, содержащий общее число ячеек изменённых всеми выполненными запросами. Если ваш блок запросов содержит SELECT, убедитесь что это самый первый запрос, в противном случае ваша окончательная выборка не будет содержать ячеек, возвращаемых этим запросом.
<?php
// создаём новую базу только в памяти $db = new sqlite_db(":memory:"); // создаём таблицу из двух столбцов bar и добавляем в неё 2 ячейки
/* Чтобы улучшить выполнение, весь блок запроса сгруппирован внутри транзакции. */ $db->query("BEGIN;
CREATE TABLE bar ( id INTEGER PRIMARY KEY, id2 );
INSERT INTO bar (id2) VALUES(1);
INSERT INTO bar (id2) VALUES(2);
COMMIT;"); // напечатает "2 insert queries" echo $db->changes()." insert queries\n"; // напечатает: "last inserted row id: 2" echo "last inserted row id: ".$db->last_insert_rowid();
?>
Новые функции
Помимо своих новых внутренних особенностей, SQLite предлагает ряд новых функций, которые упрощают и ускоряют извлечение данных из базы.
<?php
$db = new sqlite_db("db.sqlite"); /* Выполняем запрос с выборкой всех ячеек в ассоциативный массив */ $result_array = $db->array_query("SELECT * FROM foo", SQLITE_ASSOC); print_r($result_array);
?>
Это позволяет и выполнять запрос и извлекать данные одним вызовом функции, сводя на нет всю лишнюю работу PHP. Сам по себе PHP скрипт упрощается, за счёт использования всего одной функции там, где иначе бы Вам пришлось использовать несколько функций для извлечения данных работающих в цикле. В тех случаях, когда возвращается результат только одного столбца, можно использовать sqlite_single_query(), которая мгновенно возвращает строку или массив строк в зависимости от числа ячеек, из которых извлекается информация.
<?php
$db = sqlite_open("db.sqlite"); // Получаем идентификатор столбца (в качестве строки)$id = sqlite_single_query($db, "SELECT id FROM foo WHERE name='Ilia'"); var_dump($id); //string(1)
// В случае, если совпадений больше одного, результатом будет массив $ids = sqlite_single_query($db, "SELECT id FROM foo WHERE name LIKE 'I%'"); var_dump($ids); // array(3)
?>
Как и в случае с другими особенностями, вы можете этим пользоваться, но вам не следует этим злоупотреблять. В случае выборки всех данных, запросом в один проход, вы должны помнить, что все результаты будут сохраняться в памяти. Если результат выборки содержит большое количество данных, цена затрат на память безусловно сведёт на нет все преимущества полученные путём снижения числа вызовов функций. Следовательно, вам нужно приберечь использование этих функций для случаев выборки небольшого количества данных.
Итераторы в SQLite
В PHP 5.0 есть другой способ выборки данных запросом с использованием итераторов.
<?php
$db = new sqlite_db("db.sqlite"); // уменьшаем использование памяти, выполняя запрос без кэширования $res = $db->unbuffered_query("SELECT * FROM foo");
foreach ($res as $row) { // получаем результат в цикле
// Код вывода
print_r($row);
}
?>
Получение результатов в цикле работает точно так же, как и проход по массиву в цикле через foreach(), за исключением того, что в это время у вас нет доступа к ключам и значение представляет собой массив, содержащий данные в особых ячейках. Так как итераторы это не функции, а внутренние указатели в самом движке, они требуют гораздо меньше ресурсов по сравнению с функциями sqlite_fetch_*(), и не требуют, чтобы результаты кэшировались в памяти. Конечный результат будет чрезвычайно быстрым, это более простой и доступный метод извлечения данных. Нет ни каких побочных эффектов в использовании итераторов объектов в SQLite, и когда бы вам ни понадобилось получить результат в виде множества строк, вам нужно обязательно помнить о такой возможности.
Вспомогательные функции
SQLite также отличает ряд вспомогательных функций, которые могут пригодится во время работы с базой данных. Одна из таких функций, sqlite_num_fields(), может быть использована для определения количества столбцов в специальных результатах выборки. Как вариант, если вы собираетесь извлекать данные, просто используйте count() с первым результатом, которая вернёт вам то же самое число. Если извлечены как строковый, так и числовой ключи, вам понадобится отделить результат, поскольку в результирующем массиве будет столько вхождений сколько существует полей в таблице. Это число может быть важно, если вашему скрипту необходимо получить названия полей внутри какой-то таблицы. В таком случае вы могли бы использовать sqlite_field_name() в цикле, для доступа к этой информации, как показано в примере ниже.
<?php
$db = new sqlite_db("db.sqlite"); $res = $db->unbuffered_query("SELECT * FROM foo LIMIT 1"); // получаем количество полей $n_fields = $res->num_fields();
while ($i < $n_fields) {
// извлекаем отдельные поля$field_name = $res->field_name($i++);
echo $field_name."\n";
}
?>
Конечно, это не идеальный способ для получения имён столбцов из таблицы, просто по тому, что он окажется неудачным в случае, когда таблица не содержит ни одной ячейки, а также по тому, что это потребует от вас извлечения данных, которые вы не собираетесь использовать. Гораздо лучшим решением будет использование функции sqlite_fetch_column_types(), которая получает столбцы вместе с их типами из таблицы не зависимо от того, есть ли там данные или нет.
Преимущество буферизации
В большинстве случаев, по причинам выполнения или использования памяти, вы не захотите использовать запросы без кеширования. Это может привести к небольшой потери функциональности, что может быть необходимо в определённых случаях, для которых запросы без кеширования не всегда самый лучший выбор.
Например, предположим, вы хотели бы выяснить реальное количество ячеек, выбранное Вашим запросом. В запросе без кеширования, вам придётся делать выборку каждой отдельной ячейки, прежде чем вы сможете её определить. Кешированные же запросы – более простой способ, заключающийся в использовании функции sqlite_num_rows(), которая легко получит эту информацию из результата выборки. Запросы без кеширования также ограничены в прямой выборке данных, подразумевая, что вы обязаны выбрать данные из всех ячеек за один проход. В кешированных запросах такого ограничения нет, вы можете использовать sqlite_seek() для смещения на любую ячейку и выборки из неё данных, или даже для доступа к ячейкам в обратном порядке, если это необходимо.
<?php
$db = new sqlite_db("db.sqlite"); $res = $db->query("SELECT * FROM foo"); $n_rows = $res->num_rows(); // получаем число ячеек выборки $res->seek($n_rows - 1); // переходим к позиции следующей ячейки
// извлечение данных в обратном порядке do {
$data = $res->current(SQLITE_ASSOC); // получаем данные ячейки
print_r($data);
}
while ($res->hasPrev()&& $res->prev()); // и так до первой ячейки
?>
Пользовательские функции
Одна из самых интересных возможностей в том, что расширение SQLite предоставляет таблицу для возможности создания своих собственных функций используемых в пределах SQL. Это возможно благодаря тому, что SQLite содержит в одной библиотеке связанной с PHP, как интерфейс, так и сам движок базы. Используя sqlite_create_function() вы можете создавать функции, которые в дальнейшем могут быть применены к результату выборки или использованы внутри какого-нибудь условия WHERE.
<?php /* определяем разницу между строкой введённой пользователем и строкой из базы исходя из символов содержащихся в строке */ function char_compare($db_str, $user_str) {
return similar_text($db_str, $user_str);
}
$db = new sqlite_db("db.sqlite");
/* Создаём функцию char_compare() внутри SQLite на основании нашей PHP функции, char_compare(). 3-ий параметр указывает количество аргументов необходимое функции */ $db->create_function('char_compare', 'char_compare', 2);
/* Выполняем запрос, где char_compare() используется для сравнения между name и указанной строкой */ $res = $db->array_query("SELECT name, char_compare(name, 'Il2') AS sim_index FROM foo", SQLITE_ASSOC);
print_r($res);
?>
Возможность использования PHP в SQL позволяет вам упростить данный скрипт, делая его доступным большей аудитории разработчиков. Это позволяет использовать PHP в качестве движка шаблонов, который будет вставлять HTML код в данные из базы. Во многих случаях это может упростить код так сильно, что не возникнет необходимости в использовании дополнительного движка шаблонов. Помимо упрощения кода, это также улучшает выполнение программы и снижает затраты скрипта на память вследствие того, что нет ни каких действий с данными, происходящими в пользовательском пространстве.
Не забывайте, что в том случае, если данные, с которыми вы работаете, могут содержать двоичный код, вам следует использовать функцию sqlite_udf_decode_binary() для перевода их из внутренней кодировки, в которой они хранятся в SQLite, прежде чем работать с ними. Если вы так поступили, вам понадобится закодировать двоичные данные, используя sqlite_udf_encode_binary() для того, чтобы быть уверенным, что данные не будут повреждены при следующем к ним доступе.
Подведём итоги
Теперь, посмотрев как работает SQLite, и что она может предложить, вы, возможно, обратите на неё внимание для использования в своих текущих или будущих приложениях. Надеюсь, этот краткий обзор дал вам некоторое представление о функциональности SQLite, и не развеял ничего из того, что вы слышали о ней хорошего.
Как и любой инструмент, SQLite имеет свои сильные и слабые стороны. Будучи идеальным решением, для приложений небольших и/или предназначенных главным образом для считывания данных, она не очень хорошо подходит для крупномасштабных приложений, часто выполняющих запись в базу. Это ограничение – следствие того, что архитектура SQLite основана на одном единственном файле, которая не предусматривает распределения данных на многократно создаваемые файлы, а также использует блокировку на запись.
Об авторе
Ilia Alshanetsky занимается разработкой web-приложений более 7 лет, главным образом на PHP. Последние несколько лет он является активным участником в разработке PHP и соавтором ряда расширений, в том числе SQLite. В настоящее время Ilia управляет своей собственной компанией “Advanced Internet Designs Inc.”, которая специализируется на разработке и поддержке
FUDforum, форума с открытым кодом.