Spark 101: простое извлечение таблицы DDL
Чтобы получить DDL (язык определения данных) таблицы в Databricks, вы можете использовать команду SHOW CREATE TABLE
SQL. Эта команда вернет SQL-запрос, использованный для создания таблицы, включая имена столбцов, типы данных и любые ограничения или индексы, которые были определены.
Вот пример того, как вы можете использовать команду SHOW CREATE TABLE
в Databricks:
Использование SQL
%sql SHOW CREATE TABLE my_database.my_table
Использование Python
%python spark.sql("SHOW CREATE TABLE my_database.my_table").display()
Чтобы получить его для всех баз данных и таблиц, вы можете использовать следующий код.
dbs = spark.catalog.listDatabases() for db in dbs: tables = spark.catalog.listTables(db.name) for t in tables: DDL = spark.sql("SHOW CREATE TABLE {}.{}".format(db.name, t.name)) print(DDL.first()[0])
Этот оператор SHOW CREATE TABLE вернет DDL для всех таблиц, а также для представлений.
Это применимо для любой искровой экосистемы, будь то локальная или облачная, а не только Databricks.
Обратитесь к документации — https://spark.apache.org/docs/3.0.0-preview/sql-ref-syntax-aux-show-create-table.html
Счастливого обучения!