4 lutego, 2020

Jak zbudować proces ETL w Azure Databricks?

Kiedy myślimy o ETLu w chmurze, pierwsze, co przychodzi na myśl, to usługa Azure Data Factory. Rzeczywiście – z jej pomocą można zbudować całkiem rozbudowane i stabilne procesy, zwłaszcza, że niedawno dodano funkcjonalność Mapping Data Flows. Jednak co, jeśli do wykonania transformacji potrzebna jest naprawdę duża moc obliczeniowa? Wtedy należy wspomóc się czymś bardziej wydajnym. Takim rozwiązaniem jest Apache Spark ukrywający się pod nazwą Azure Databricks.