Показаны различия между двумя версиями страницы.
Предыдущая версия справа и слеваПредыдущая версияСледующая версия | Предыдущая версия | ||
superset:work_in_superset:databases:databases [2023/11/14 15:19] – e.nesterova@corp.nstu.ru | superset:work_in_superset:databases:databases [2023/11/15 11:30] (текущий) – e.nesterova@corp.nstu.ru | ||
---|---|---|---|
Строка 1: | Строка 1: | ||
====== Базы данных (Databases)====== | ====== Базы данных (Databases)====== | ||
<WRAP group> | <WRAP group> | ||
- | < | + | <WRAP column |
**Базы данных** – упорядоченный набор структурированной информации или данных, | **Базы данных** – упорядоченный набор структурированной информации или данных, | ||
Раздел настройки подключения к разным базам данных находится **Настройки -> Данные -> Базы данных**. | Раздел настройки подключения к разным базам данных находится **Настройки -> Данные -> Базы данных**. | ||
</ | </ | ||
- | < | + | <WRAP column |
{{: | {{: | ||
</ | </ | ||
Строка 12: | Строка 12: | ||
\\ | \\ | ||
<WRAP group> | <WRAP group> | ||
- | < | + | <WRAP column |
Интерфейс раздела **Базы данных** выглядит следующим образом: | Интерфейс раздела **Базы данных** выглядит следующим образом: | ||
\\ | \\ | ||
- | Справа расположены кнопки для добавления базы данных и таблицы из файлов ([[superset: | + | Справа расположены кнопки для добавления базы данных и таблицы из файлов (CSV, Excel, столбчатый формат).\\ |
Ниже - окно **поиска** и окна для **фильтрации** загруженных баз данных: | Ниже - окно **поиска** и окна для **фильтрации** загруженных баз данных: | ||
* возможно ли использовать базу данных в SQL редакторе; | * возможно ли использовать базу данных в SQL редакторе; | ||
* возможно ли использовать асинхронный режим работы.\\ | * возможно ли использовать асинхронный режим работы.\\ | ||
+ | Для загруженных баз данных отображаются следующие атрибуты: | ||
+ | * **База данных** – имя базы данных (как вы ее назвали при добавлении); | ||
+ | * **Драйвер** – используемая система управления базами данных; | ||
+ | * **Асинхронные запросы (AQE, Asynchronous Query Execution)** – поддерживается ли асинхронный режим работы; | ||
+ | * **DML (Data Manipulation Language)** – поддерживается ли язык манипулирования данными (вставка, | ||
+ | * **Загрузить CSV** – поддерживается ли загрузка CSV-файлов; | ||
+ | * **Доступен в SQL редакторе** – разрешено ли использовать в SQL редакторе; | ||
+ | * **Кем создано** – кем создана база данных; | ||
+ | * **Последнее изменение** – когда было сделано последнее изменение; | ||
+ | * **Действия** – доступные действия, | ||
+ | * Удалить; | ||
+ | * Экспортировать; | ||
+ | * Редактировать. | ||
</ | </ | ||
+ | <WRAP column 50%> | ||
+ | {{: | ||
+ | |||
+ | </ | ||
+ | </ | ||
+ | |||
+ | ===== Подключение базы данных ===== | ||
+ | <WRAP group> | ||
<WRAP half column> | <WRAP half column> | ||
- | {{:superset:work_in_superset:databases:databases_4.png? | + | ==== Шаг 1. Создание новой базы данных. ==== |
+ | В разделе **Базы данных** нажимаем справа кнопку **+ БАЗА ДАННЫХ**. | ||
+ | ==== Шаг 2. Выбор базы данных. ==== | ||
+ | * Выбираем в диалоговом окне PostgreSQL или SQLite. | ||
+ | * Для подключения другой базы данных воспользуйтесь выпадающим списком ниже «Поддерживаемые базы данных». | ||
+ | * Или импортируйте свою базу данных из файла. | ||
+ | ==== Шаг 3. Настройка базы данных. ==== | ||
+ | === Для баз данных Postgres и SQLite нужно ввести следующие параметры: === | ||
+ | * **Хост** – IP-адрес или доменное имя; | ||
+ | * **Порт** – порт хоста (5432, по умолчанию для PostgreSQL); | ||
+ | * **Имя базы данных** – имя базы данных; | ||
+ | * **Имя пользователя** – пользователь СУБД, у которого выданы права на подключения к базе данных; | ||
+ | * **Пароль** – пароль пользователя; | ||
+ | * **Отображаемое имя** – имя подключения, | ||
+ | * **Дополнительные параметры** – добавление дополнительных пользовательских параметров; | ||
+ | * **SSL** – включает ssl-шифрование подключения (если поддерживается); | ||
+ | * **SSH Tunnel** – включает SSH-туннели. | ||
+ | === Для других поддерживаемых баз данных введите следующие параметры: === | ||
+ | * **Отображаемое имя** – имя подключения, | ||
+ | * **SQLAlchemy URI** в виде диалект+драйвер:< | ||
+ | * **Диалект+Драйвер** – например, | ||
+ | * **Пользователь** – пользователь СУБД, у которого выданы права на подключения к базе данных; | ||
+ | * **Пароль** – пароль пользователя; | ||
+ | * **Хост** – IP-адрес или доменное имя; | ||
+ | * **Порт** – порт хоста (1521, по умолчанию для Oracle); | ||
+ | * **Схема** – используемая схема базы данных. | ||
+ | Нажмите кнопку **Тестовое соединение**. При успешном соединении, | ||
</ | </ | ||
+ | |||
+ | <WRAP half column > | ||
+ | <WRAP group> | ||
+ | <WRAP column 30%> | ||
+ | {{: | ||
</ | </ | ||
+ | <WRAP column | ||
+ | {{: | ||
+ | </ | ||
+ | |||
+ | <WRAP column | ||
+ | {{: | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | </ | ||
+ | </ | ||
+ | |||
+ | <WRAP group> | ||
+ | <WRAP half column> | ||
+ | ==== Шаг 4. Продвинутая настройка ==== | ||
+ | * **Лаборатория SQL** – настройка взаимодействия базы данных с Лабораторией SQL: | ||
+ | * **Предоставить доступ к базе в Лаборатории SQL** – разрешить запросы к этой базе дынных; | ||
+ | * **Разрешить CREATE TABLE AS** – разрешить создавать таблицы на основе запросов; | ||
+ | * **Разрешить CREATE VIEW AS** – разрешить создавать представления на основе запросов; | ||
+ | * **Разрешить DML** – разрешить команды UPDATE, DELETE, CREATE и пр. над базой данных; | ||
+ | * **Разрешить оценку стоимости запроса** – показывать кнопку подсчета стоимости запроса перед его выполнением (для Bigquery, Presto и Postgres); | ||
+ | * **Разрешить изучение этой базы данных** – пользователям разрешено смотреть ответ на запрос к этой базе в Лаборатории SQL; | ||
+ | * **Отключить предпросмотр данных в Лаборатории SQL** – отключить предпросмотр данных при извлечении метаданных таблицы в Лаборатории SQL (полезно для избежания проблем с производительностью браузера при использовании баз данных с очень широкими таблицами); | ||
+ | * **Производительность** – параметры производительности для базы данных: | ||
+ | * **Время жизни кэша графика** – длительность (сек.) таймаута кэша для графиков, | ||
+ | * **Время жизни кэша схемы** – длительность (сек.) таймаута кэша для схем, использующих эту базу данных; | ||
+ | * **Время жизни кэша таблицы** – длительность (сек.) таймаута кэша для таблиц, | ||
+ | * **Асинхронное выполнение запросов** – работа с базой данных в асинхронном режиме означает, | ||
+ | * **Отменять запрос при закрытии вкладки** – завершать выполнение запросов после закрытия браузерной вкладки или после того, как пользователь переключится на другую вкладку (доступно для Presto, Hive, MySQL, Postgres, Snowflake); | ||
+ | * **Безопасность** – дополнительная информация по подключению: | ||
+ | * **Безопасность** – JSON-строка, | ||
+ | * **Корневой сертификат**; | ||
+ | * **Имперсонировать пользователя**; | ||
+ | * **Разрешить загрузку файлов в базу данных**; | ||
+ | * **Прочее**: | ||
+ | * **Параметры метаданных**; | ||
+ | * **Параметры драйвера**; | ||
+ | * **Версия**. | ||
+ | ====Шаг 5. После всех настроек нажмите кнопку Завершить.==== | ||
+ | |||
+ | </ | ||
+ | |||
+ | <WRAP half column> | ||
+ | <WRAP half column> | ||
+ | {{: | ||
+ | </ | ||
+ | <WRAP half column> | ||
+ | {{: | ||
+ | </ | ||
+ | \\ | ||
+ | <WRAP half column> | ||
+ | {{: | ||
+ | </ | ||
+ | <WRAP half column> | ||
+ | {{: | ||
+ | </ | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | |||
+ | ===== Импорт из файлов ===== | ||
+ | ==== Импорт данных из CSV в базу данных ==== | ||
+ | <WRAP group> | ||
+ | <WRAP half column> | ||
+ | В разделе **Базы данных**, | ||
+ | Далее необходимо заполнить следующее: | ||
+ | * **Загрузка CSV** - прикрепите сюда CSV-файл, | ||
+ | * **Имя таблицы** - имя таблицы, | ||
+ | * **База данных** – база данных, | ||
+ | * **Схема** – схема, в которую будет добавлена таблица (если это поддерживается базой данных); | ||
+ | * **Разделитель** – разделитель, | ||
+ | * **File Settings**: | ||
+ | * **Если таблица уже существует** – что должно произойти, | ||
+ | * **Пропуск начального пробела** – пропустить пробелы после разделителя; | ||
+ | * **Пропуск пустых строк** – пропустите пустые строки, | ||
+ | * **Список столбцов, | ||
+ | * **Автоматически интерпретировать форматы даты и времени** – автоматическая интерпретация формата даты и времени; | ||
+ | * **Day First** – формат даты, где сначала день, потом месяц (международный и Европейский формат); | ||
+ | * **Десятичный разделитель** - символ, | ||
+ | * **Пустые значения** – JSON-список значений, | ||
+ | * **Columns**: | ||
+ | * **Индексный столбец** – столбец для использования в качестве меток строк данных. Оставьте пустым, | ||
+ | * **Индекс датафрейма** – сделать индекс датафрейма столбцом; | ||
+ | * **Метка(и) столбца(ов)** – метка для индексного(ых) столбца(ов). Если не задано и задан индекс датафрейма, | ||
+ | * **Столбцы для чтения** – JSON-список имен столбцов, | ||
+ | * **Перезаписать повторяющиеся столбцы** – если повторяющиеся столбцы не перезаписываются, | ||
+ | * **Расширенный тип данных** – словарь с именами столбцов и их тип данных, | ||
+ | * **Rows**: | ||
+ | * **Строка заголовка** – строка, | ||
+ | * **Строки для чтения** – количество строк файла для чтения; | ||
+ | * **Пропуск строк** – количество первых строк, которые нужно пропустить. | ||
+ | После заполнения необходимых параметров, | ||
+ | |||
+ | |||
+ | </ | ||
+ | |||
+ | <WRAP half column> | ||
+ | {{: | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | |||
+ | <WRAP group> | ||
+ | <WRAP half column> | ||
+ | ==== Импорт данных из Excel в базу данных ==== | ||
+ | В разделе **Базы данных**, | ||
+ | Далее необходимо заполнить следующие параметры: | ||
+ | * **Имя таблицы** – имя таблицы, | ||
+ | * **Excel-файл** – прикрепите сюда Excel-файл, | ||
+ | * **Имя листа** – имя листа (по умолчанию первый лист); | ||
+ | * **База данных** – база данных, | ||
+ | * **Схема** – схема, в которую будет добавлена таблица (если это поддерживается базой данных); | ||
+ | * **Таблица существует** – что должно произойти, | ||
+ | * **Строка заголовка** – строка, | ||
+ | * **Индексный столбец** – столбец для использования в качестве меток строк данных; | ||
+ | * **Управление повторяющимися столбцами** – обозначить повторяющиеся столбцы как «X.0, X.1»; | ||
+ | * **Пропуск строк** – количество первых строк, которые нужно пропустить; | ||
+ | * **Строки для чтения** - количество строк файла для чтения; | ||
+ | * **Парсинг дат** – разделённый запятыми список столбцов, | ||
+ | * **Десятичный символ** – символ, | ||
+ | * **Индекс датафрейма** – записать индекс датафрейма, | ||
+ | * **Метка(и) столбца(ов)** – обозначение столбца для столбцов с индексами. Если поле пустое, | ||
+ | * **Пустые значения** – JSON-список значений, | ||
+ | После заполнения необходимых параметров, | ||
+ | |||
+ | </ | ||
+ | |||
+ | <WRAP half column> | ||
+ | |||
+ | </ | ||
+ | </ | ||
+ | |||
+ | |||
+ | <WRAP group> | ||
+ | <WRAP half column> | ||
+ | ==== Импорт данных столбчатого формата ==== | ||
+ | В разделе **Базы данных**, | ||
+ | |||
+ | Далее необходимо заполнить следующие: | ||
+ | * **Имя таблицы** – имя таблицы, | ||
+ | * **Файл столбчатого формата** – прикрепите сюда файл, который будет загружен в базу данных; | ||
+ | * **База данных** – база данных, | ||
+ | * **Схема** – схема, в которую будет добавлена таблица (если это поддерживается базой данных); | ||
+ | * **Таблица существует** – что должно произойти, | ||
+ | * **Используемые столбцы** – JSON-список имен столбцов, | ||
+ | * **Индекс датафрейма** – записать индекс датафрейма, | ||
+ | * **Метка(и) столбца(ов)** – обозначение столбца для столбцов с индексами. Если поле пустое, | ||
+ | После заполнения необходимых параметров, | ||
+ | |||
+ | </ | ||
+ | |||
+ | <WRAP half column> | ||
+ | {{: | ||
+ | </ | ||
+ | </ | ||
- | Для загруженных баз данных отображаются следующие атрибуты: | ||
- | * **База данных** – имя базы данных (как вы ее назвали при добавлении) | ||
- | * **Backend** – используемая система управления базами данных | ||
- | * **AQE (Asynchronous Query Execution)** – поддерживается ли асинхронный режим работы | ||
- | * **DML (Data Manipulation Language)** – поддерживается ли язык манипулирования данными | ||
- | * **Загрузить CSV** – поддерживается ли загрузка CSV-файлов | ||
- | * **Открыть в SQL редакторе** – разрешено ли использовать в SQL редакторе | ||
- | * **Дата создания** – <color # | ||
- | * **Изменено** – когда было сделано последнее изменение | ||
- | * **Действия** – доступные действия, | ||
- | * Удалить | ||
- | * Экспортировать | ||
- | * Редактировать | ||
- | ===== Подключение базы данных. Импорт данных из файлов ===== | ||
- | * [[superset: | ||
- | * [[superset: | ||
- | * [[superset: | ||
- | * [[superset: | ||
- | * [[superset: | ||
- | * [[superset: | ||