База знаний НГТУ НЭТИ

Технологии, которые работают

Инструменты пользователя

Инструменты сайта


superset:work_in_superset:databases:databases

Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

Предыдущая версия справа и слеваПредыдущая версия
Следующая версия
Предыдущая версия
superset:work_in_superset:databases:databases [2023/11/14 17:11] e.nesterova@corp.nstu.rusuperset:work_in_superset:databases:databases [2023/11/15 11:30] (текущий) e.nesterova@corp.nstu.ru
Строка 139: Строка 139:
  
  
 +===== Импорт из файлов =====
 +==== Импорт данных из CSV в базу данных ====
 +<WRAP group>
 +<WRAP half column>
 +В разделе **Базы данных**, нажимаем справа на выпадающий список **Загрузить файл в базу данных** (рядом с кнопкой  **+ БАЗА ДАННЫХ**). Из списка выбираем **Загрузить CSV**. \\ \\
 +Далее необходимо заполнить следующее:
 +  * **Загрузка CSV** - прикрепите сюда CSV-файл, который будет загружен в базу данных;
 +  * **Имя таблицы** - имя таблицы, которая будет сформирована из данных csv;
 +  * **База данных** – база данных, в которую будет добавляться таблица;
 +  * **Схема** – схема, в которую будет добавлена таблица (если это поддерживается базой данных);
 +  * **Разделитель** –  разделитель, используемый в CSV-файле;
 +  * **File Settings**:
 +    * **Если таблица уже существует** –  что должно произойти, если таблица уже существует: Ошибка (Fail) –  ничего не делать, Заменить (Replace) –  удалить и заново создать таблицу или Добавить (Append) - добавить данные;
 +    * **Пропуск начального пробела** –  пропустить пробелы после разделителя;
 +    * **Пропуск пустых строк** – пропустите пустые строки, а не интерпретировать их как значения NaN;
 +    * **Список столбцов, которые должны быть интерпретированы как даты** – разделённый запятыми список столбцов, которые должен быть интерпретированы как даты;
 +    * **Автоматически интерпретировать форматы даты и времени** – автоматическая интерпретация формата даты и времени;
 +    * **Day First** – формат даты, где сначала день, потом месяц (международный и Европейский формат);
 +    * **Десятичный разделитель** - символ, который интерпретируется как десятичная точка;
 +    * **Пустые значения** – JSON-список значений, который нужно интерпретировать как Пусто (null);
 +  * **Columns**:
 +    * **Индексный столбец** – столбец для использования в качестве меток строк данных. Оставьте пустым, если столбец индекса отсутствует;
 +    * **Индекс датафрейма** – сделать индекс датафрейма столбцом;
 +    * **Метка(и) столбца(ов)** – метка для индексного(ых) столбца(ов). Если не задано и задан индекс датафрейма, будут использованы имена индексов;
 +    * **Столбцы для чтения** – JSON-список имен столбцов, которые будут использоваться;
 +    * **Перезаписать повторяющиеся столбцы** – если повторяющиеся столбцы не перезаписываются, они будут представлены в формате «X.0, X.1»;
 +    * **Расширенный тип данных** – словарь с именами столбцов и их тип данных, на который нужно изменить. <code>Например, {‘user_id’: ‘integer’};</code>
 +  * **Rows**:
 +    * **Строка заголовка** –  строка, содержащая заголовки для использования в качестве имен столбцов (0 - первая строка данных). Оставьте пустым, если строка заголовка отсутствует;
 +    * **Строки для чтения** –  количество строк файла для чтения;
 +    * **Пропуск строк** –  количество первых строк, которые нужно пропустить.
 +После заполнения необходимых параметров, нажмите внизу кнопку **Сохранить**.
  
  
 +</WRAP>
  
 +<WRAP half column>
 +{{:superset:work_in_superset:databases:db_10.png?nolink|}}
 +</WRAP>
 +</WRAP>
  
  
-===== Подключение базы данных. Импорт данных из файлов ===== +<WRAP group> 
-  * [[superset:work_in_superset:databases:connection_to_postgres|Подключение базы данных Postgres]] +<WRAP half column> 
-  * [[superset:work_in_superset:databases:connection_to_oracle|Подключение базы данных Oracle]] +==== Импорт данных из Excel в базу данных ==== 
-  * [[superset:work_in_superset:databases:connection_to_other_db|Подключение других баз данных]+В разделе **Базы данных**, нажимаем справа на выпадающий список **Загрузить файл в базу данных** (рядом с кнопкой **+ БАЗА ДАННЫХ**). Из списка выбираем **Загрузить файл Excel**. \\ \\ 
-  * [[superset:work_in_superset:databases:import_from_csv_to_db|Импорт данных из CSV в базу данных]] +Далее необходимо заполнить следующие параметры: 
-  * [[superset:work_in_superset:databases:import_from_excel_to_db|Импорт данных из Excel в базу данных]] +  * **Имя таблицы** – имя таблицы, которая будет сформирована из данных Excel; 
-  * [[superset:work_in_superset:databases:import_from_columnar_to_db|Импорт столбчатых данных в базу данных]]+  * **Excel-файл** – прикрепите сюда Excel-файл, который будет загружен в БД; 
 +  * **Имя листа** – имя листа (по умолчанию первый лист); 
 +  * **База данных** – база данных, в которую будет добавляться таблица; 
 +  * **Схема** – схема, в которую будет добавлена таблица (если это поддерживается базой данных); 
 +  * **Таблица существует** – что должно произойти, если таблица уже существуетОшибка (Fail) – ничего не делать, Заменить (Replace) – удалить и заново создать таблицу или Добавить (Append) – добавить данные; 
 +  * **Строка заголовка** – строка, содержащая заголовки для использования в качестве имен столбцов (0 - первая строка данных); оставьте пустым, если строка заголовка отсутствует; 
 +  * **Индексный столбец** – столбец для использования в качестве меток строк данных; оставьте пустым, если столбец индекса отсутствует; 
 +  * **Управление повторяющимися столбцами** – обозначить повторяющиеся столбцы как «X.0, X.1»; 
 +  * **Пропуск строк** – количество первых строк, которые нужно пропустить; 
 +  * **Строки для чтения** - количество строк файла для чтения; 
 +  * **Парсинг дат** – разделённый запятыми список столбцов, которые должен быть интерпретированы как даты; 
 +  * **Десятичный символ** – символ, который интерпретируется как десятичная точка; 
 +  * **Индекс датафрейма** – записать индекс датафрейма, как отдельный столбец; 
 +  * **Метка(и) столбца(ов)** – обозначение столбца для столбцов с индексами. Если поле пустое, а настройка [Индексвключена, то используются имена индексов; 
 +  * **Пустые значения** – JSON-список значений, который нужно интерпретировать как Пусто (null). 
 +После заполнения необходимых параметров, нажмите внизу кнопку **Сохранить**. 
 + 
 +</WRAP> 
 + 
 +<WRAP half column> 
 + 
 +</WRAP> 
 +</WRAP> 
 + 
 + 
 +<WRAP group> 
 +<WRAP half column> 
 +==== Импорт данных столбчатого формата ==== 
 +В разделе **Базы данных**, нажимаем справа на выпадающий список **Загрузить файл в базу данных** (рядом с кнопкой **+ БАЗА ДАННЫХ**). Из списка выбираем **Загрузить файл столбчатого формата**. \\ \\ 
 + 
 +Далее необходимо заполнить следующие: 
 +  * **Имя таблицы** – имя таблицы, которая будет сформирована из данных
 +  * **Файл столбчатого формата** – прикрепите сюда файл, который будет загружен в базу данных; 
 +  * **База данных** – база данных, в которую будет добавляться таблица; 
 +  * **Схема** – схема, в которую будет добавлена таблица (если это поддерживается базой данных); 
 +  * **Таблица существует** – что должно произойти, если таблица уже существуетОшибка (Fail) – ничего не делать, Заменить (Replace) – удалить и заново создать таблицу или Добавить (Append) – добавить данные; 
 +  * **Используемые столбцы** – JSON-список имен столбцов, которые будут использоваться. Например, ["id", "name", "gender", "age"]. Если ничего не указано, то все столбцы из файла будут добавлены
 +  * **Индекс датафрейма** – записать индекс датафрейма, как отдельный столбец; 
 +  * **Метка(и) столбца(ов)** – обозначение столбца для столбцов с индексами. Если поле пустое, а настройка [Индекс] включена, то используются имена индексов. 
 +После заполнения необходимых параметров, нажмите внизу кнопку **Сохранить**. 
 + 
 +</WRAP> 
 + 
 +<WRAP half column> 
 +{{:superset:work_in_superset:databases:db_10.png?nolink|}} 
 +</WRAP> 
 +</WRAP> 
  
superset/work_in_superset/databases/databases.1699956683.txt.gz · Последнее изменение: 2023/11/14 17:11 — e.nesterova@corp.nstu.ru