Интерактивный и встроенный SQL
Имеются два SQL: Интерактивный(Interactive)иВстроенный(Embedded). Большей частью, обе формы работают одинаково, но используются различно.
Интерактивный SQL используется для функционирования непосредственно в базе данных, чтобы производить вывод для использования его заказчиком. В этой форме SQL, когда вы введете команду, она сейчас же выполнится, и вы сможете увидеть вывод (если он вообще получится) — немедленно.
Встроенный SQL состоит из команд SQL, помещенных внутри программ, которые обычно написаны на некотором другом языке (типа КОБОЛА или Паскаля). Это делает эти программы более мощными и эффективным. Однако, допуская эти языки, приходится иметь дело со структурой SQL и стилем управления данными, который требует некоторых расширений к интерактивному SQL. Передача SQL команд во встроенный SQL является выдаваемой ("passed off") для переменных или параметров используемых программой в которую они были вложены.
В этой книге, мы будем представлять SQL в интерактивной форме. Это даст нам возможность обсуждать команды и их эффекты, не заботясь о том, как они связаны с помощью интерфейса с другими языками. Интерактивный SQL — это форма наиболее полезная непрограммистам. Все, что вы узнаете относительно интерактивного SQL, в основном применимо и к вложенной форме. Изменения, необходимые для использования встроенной формы, будут описаны в последней главе этой книги.
Подразделы SQL
И в интерактивной, и во встроенной формах SQL, имеются многочисленные части, или подразделы. Так как вы, вероятно, столкнетесь с этой терминологией при чтении SQL, мы дадим некоторые пояснения. К сожалению, эти термины не используются повсеместно во всех реализациях. Они подчеркиваются ANSI и полезны на концептуальном уровне, но большинство SQL программ практически не обрабатывают их отдельно, так что они по существу становятся функциональными категориями команд SQL.
DDL(Data Definition Language — Язык Определения Данных) — так называемый Язык Описания Схемы в ANSI, состоит из команд, которые создают объекты (таблицы, индексы, просмотры, и так далее) в базе данных.
DML (Data Manipulation Language — Язык Манипулирования Данными) — это набор команд, которые определяют, какие значения представлены в таблицах в любой момент времени.
DCL(Data Control Language — Язык Управления Данными) состоит из средств, которые определяют, разрешить ли пользователю выполнять определенные действия или нет.
Они являются составными частями SQL в ANSI. Не забывайте эти имена. Это не различные языки, а разделы команд SQL, сгруппированных по их функциям.
Различные типы данных
Не все типы значений, которые могут занимать поля таблицы — логически одинаковые. Наиболее очевидное различие — между числами и текстом. Вы не можете помещать числа в алфавитном Заказе или вычитать одно имя из другого. Так как системы с реляционной базой данных базируются на связях между фрагментами информации, различные типы данных должны понятно отличаться друга от друга, так чтобы соответствующие процессы и сравнения могли быть в них выполнены.
В SQL это делается с помощью назначения каждому полю типа данных, который указывает на тип, значения, которое это поле может содержать. Все значения в данном поле должны иметь одинаковый тип. В таблице Заказчиков, например, cname и city — содержат строки текста для оценки, snum, и cnum — это уже номера. По этой причине, вы не можете ввести значение Highest (Наивысший) или значение None (Никакой) в поле rating, которое имеет числовой тип данных. Это ограничение удачно, так как оно налагает некоторую структурность на ваши данные. Вы часто будете сравнивать некоторые или все значения в данном поле, поэтому вы можете выполнять действие только на определенных строках, а не на всех. Вы не могли бы сделать этого, если бы значения полей имели смешанный тип данных.
К сожалению, определение этих типов данных является основной областью, в которой большинство коммерческих программ баз данных и официальный стандарт SQL не всегда совпадают. ANSI SQL стандарт распознает только текст и тип номера, в то время как большинство коммерческих программ используют другие специальные типы. Такие как, DATA (ДАТА) и TIME (ВРЕМЯ) — фактически почти стандартные типы (хотя точный формат их меняется). Некоторые пакеты также поддерживают такие типы, как,например, MONEY (ДЕНЬГИ) и BINARY (ДВОИЧНЫЕ).
ANSI определяет несколько различных типов значений чисел, различия между которыми довольно тонки, и иногда их путают. Разрешенные ANSI типы данных перечислены в Приложении B.
Сложность числовых типов ANSI можно, по крайней мере, частично, объяснить усилием сделать встроенный SQL, совместимым с рядом других языков.
Два типа чисел ANSI, INTEGER (ЦЕЛОЕ ЧИСЛО) и DECIMAL (ДЕСЯТИЧНОЕ ЧИСЛО) (которые можно сокращать как INTиDEC, соответственно), будут адекватны для наших целей, также как и для целей большинства практических деловых прикладных программ. Естественно, что тип ЦЕЛОЕ можно представить как ДЕСЯТИЧНОЕ ЧИСЛО, которое не содержит никаких цифр справа от десятичной точки.
Тип для текста — CHAR(или СИМВОЛ), который относится к строке текста. Поле типа CHAR имеет определенную длину, которая определяется максимальным числом символов, которые могут быть введены в это поле. Больше всего реализаций также имеют нестандартный тип называемый VARCHAR (ПЕРЕМЕННОЕ ЧИСЛО СИМВОЛОВ), который является текстовой строкой, которая может иметь любую длину до определенного реализацией максимума (обычно 254 символа). CHARACTER и VARCHAR значения включаются в одиночные кавычки как 'текст'. Различие между CHAR и VARCHAR в том, что CHAR должен резервировать достаточное количество памяти для максимальной длины строки, а VARCHAR распределяет память так, как это необходимо.
Символьные типы состоят из всех печатных символов, включая числа. Однако, номер 1 не то же что символ '1'. Символ '1' — только другой печатный фрагмент текста, не определяемый системой как наличие числового значения 1. Например, 1 + 1 = 2, но '1' + '1' не равняется '2'. Символьные значения сохраняются в компьютере как двоичные значения, но показываются пользователю как печатный текст. Преобразование следует за форматом определяемым системой, которую вы используете. Этот формат преобразования будет одним из двух стандартных типов (возможно с расширениями), используемых в компьютерных системах: в ASCII коде (используемом во всех персональных и малых компьютерах) и EBCDIC коде (Расширенном Двоично-десятичном Коде Обмена Информации) (используемом в больших компьютерах). Определенные операции, такие как упорядочивание в алфавитном порядке значений поля, будет изменяться вместе с форматом. Применение этих двух форматов будет обсуждаться в Главе 4.
Мы должны следить за рынком, а не ANSI, в использовании типа называемого DATE (в системе, которая не распознает тип DATE, вы, конечно, можете объявить дату как символьное или числовое поле, но это сделает большинство операций более трудоемкими). Обратитесь к документации по пакету программ, который вы будете использовать, чтобы выяснить точно, какие типы данных он поддерживает.
Несогласованности SQL
Вы можете понять из предшествующего обсуждения, что внутри продуктов мира SQL имеются некоторые несогласованности. SQL появился из коммерческого мира баз данных как инструмент, и был позже превращен в стандарт ANSI. К сожалению, ANSI не всегда определяет наибольшую пользу, поэтому программисты пытаются соответствовать стандарту ANSI, не позволяя ему ограничивать их слишком сильно. ANSI — вид минимального стандарта — вы можете делать больше, чем он это позволяет, но вы должны быть способны получить те же результаты, что и при выполнении задачи на основе стандарта.
Что такое пользователь?
SQL обычно используется в компьютерных системах, которые имеют больше, чем одного пользователя, и, следовательно, должны различать их (ваше семейство PC может иметь любое число пользователей, но оно обычно не имеет способов, чтобы отличать одного от другого). Обычно, в такой системе каждый пользователь имеет некий вид кода проверки прав, который идентифицирует его или ее (терминология изменяется). В начале сеанса с компьютером, пользователь входит в систему (регистрируется), сообщая компьютеру, кто этот пользователь, идентифицированный с помощью определенного идентификатора (ID). Любое количество людей, использующих тот же самый ID доступа, являются отдельными пользователями; и аналогично, один человек может представлять большое количество пользователей (в разное время), используя различные доступные Идентификаторы.
SQL следует этому примеру. Действия в большинстве сред SQL приведены к специальному Идентификатору, который точно соответствует определенному пользователю. Таблица или другой объект принадлежит пользователю, который имеет над ним полную власть. Пользователь может или не может иметь привилегии, чтобы выполнять действие над объектом. Для наших целей, мы договоримся, что любой пользователь имеет привилегии, необходимые, чтобы выполнять любое действие, пока мы не возвратимся специально к обсуждению привилегий в Главе 22.
Специальное значение — USER (ПОЛЬЗОВАТЕЛЬ) может использоваться как аргумент в команде. Оно указывает на доступный Идентификатор пользователя, выдавшего команду.
Условия и терминология
Ключевые слова — это слова, которые имеют специальное значение в SQL. Они могут быть командами, но не текстом и не именами объектов. Мы будем выделять ключевые слова, печатая их ЗАГЛАВНЫМИ БУКВАМИ. Вы должны соблюдать осторожность, чтобы не путать ключевые слова с терминами.
SQL имеет определенные специальные термины, которые используются, чтобы описывать его. Среди них — такие слова как запрос, предложение и предикат, которые являются важнейшими в описании и понимании языка, но не означают что-нибудь самостоятельное для SQL.
Команды, или предложения, являются инструкциями, которыми Вы обращаетесь к SQL базе данных. Команды состоят из одной или более отдельных логических частей, называемых предложениями. Предложения начинаются ключевым словом, для которого они являются поименованными, и состоят из ключевых слов и аргументов. Например, предложения, с которыми вы можете сталкиваться — это "FROM Salespeope" и “WHERE city = 'London'”. Аргументы завершают или изменяют значение предложения. В примерах выше, Salespeople — аргумент, а FROM — ключевое слово предложения FROM. Аналогично, “city = 'London'” — агрумент предложения WHERE.
Объекты — структуры в базе данных, которым даны имена и сохраняются в памяти. Они включают в себя базовые таблицы, представления (два типа таблиц), ииндексы. Чтобы показать Вам, как формируются команды, мы будем делать это на примерах. Имеется, однако, более формальный метод описания команд, использующих стандартизированные условные обозначения. Мы будем использовать его в более поздних главах, для удобства, чтобы понимать эти условные обозначения в случае, если вы столкнетесь с ним в других SQL документах.
Квадратные скобки ([ ]) будут указывать части, которые могут не использоваться, а многоточия (...) указывать, что все предшествующее им может повторяться любое число раз. Слова, обозначенные в угловых скобках (<>) — специальные термины, которые объясняют, что они собой представляют. Мы упростили стандартную терминологию SQL значительно, но без ухудшения его понимания.
Резюме
Мы быстро прошли основы в этой главе. Но нашим намерением и было — просто пролететь над основами SQL, так чтобы вы могли понять идею относительно всего объема.
Когда мы возвратимся к основе в следующей главе, некоторые вещи станут более конкретными. Теперь вы знаете кое-что относительно SQL — какова его структура, как он используется, как он представляет данные, и как они определяются (и некоторые несогласованности появляющиеся при этом), и некоторые условные обозначения и термины, используемые чтобы описывать их.
Все это — много информации для одной главы; мы не ожидаем, чтобы вы запомнили все эти подробности, но вы сможете вернуться к ним позже, если понадобится.
По Главе 3, мы будем идти, показывая конкретно, как формируются команды, и что они делают. Мы представим вам команду SQL, используемую, чтобы извлекать информацию из таблиц, и которая является наиболее широко используемой командой в SQL. К концу этой главы, вы будете способны извлекать конкретную информацию из вашей базы данных с высокой степенью точности.
Работа с SQL
1. Какое наибольшее основное различие между типами данных в SQL?
2. Распознает ANSI тип данных DATA?
3. Какой подраздел SQL используется чтобы помещать значения в таблицы ?
4. Что такое — ключевое слово?
(См. Приложение A для ответов.)