Spark 101: простое извлечение таблицы DDL

Чтобы получить DDL (язык определения данных) таблицы в Databricks, вы можете использовать команду SHOW CREATE TABLE SQL. Эта команда вернет SQL-запрос, использованный для создания таблицы, включая имена столбцов, типы данных и любые ограничения или индексы, которые были определены.

Вот пример того, как вы можете использовать команду SHOW CREATE TABLE в Databricks:

Использование SQL

%sql
SHOW CREATE TABLE my_database.my_table

Использование Python

%python
spark.sql("SHOW CREATE TABLE my_database.my_table").display()

Чтобы получить его для всех баз данных и таблиц, вы можете использовать следующий код.

dbs = spark.catalog.listDatabases()
for db in dbs:
  tables = spark.catalog.listTables(db.name)
  for t in tables:
    DDL = spark.sql("SHOW CREATE TABLE {}.{}".format(db.name, t.name))
    print(DDL.first()[0])

Этот оператор SHOW CREATE TABLE вернет DDL для всех таблиц, а также для представлений.

Это применимо для любой искровой экосистемы, будь то локальная или облачная, а не только Databricks.

Обратитесь к документации — https://spark.apache.org/docs/3.0.0-preview/sql-ref-syntax-aux-show-create-table.html

Счастливого обучения!