(相關資料圖)

Databricks 是一家從加州大學伯克利分校的 AMPLab 項目發展而來的公司,由 Apache Spark 的創建者創立。

注:Apache Spark 是一個開源的統一分析引擎,用于大規模數據處理,該項目最初是由加州大學伯克利分校的 AMPLab 開發,后來捐贈給 Apache 軟件基金會(ASF)。

Databricks 近日宣布,推出了用于 Databricks 的 Visual Studio Code 擴展。

這個新的擴展可以讓開發者利用 VS Code 的強大功能在本地編寫代碼,同時連接到 Databricks 集群并遠程運行代碼,開發者在這個過程中可以使用 VS Code 中自己熟悉的各種功能,包括代碼版本控制、單元測試、高級查找和替換、窗口拆分,以及 CI/CD 等來加速開發。

Databricks 在官方公告中表示,對于依賴 IDE 進行開發的團隊,VS Code Extension for Databricks 將是許多計劃版本中的第一個,而且 Databricks 正在大力投資開發者生態,還會推出對其他 IDE 和工具的支持。

根據官方介紹,VS Code Extension for Databricks 目前具有的功能包括,將代碼同步到 Databricks 工作區、在 Databricks 集群上運行 Python 文件,以及作為工作流運行 notebooks 和 Python 文件等。

當然為了使用這個擴展,它也具有一定的使用要求:

具備以下條件的 Databricks 工作空間啟用Repos啟用Files in Repos允許使用個人訪問令牌(PAT)或 Azure AD CLI 訪問工作區訪問交互式集群或創建集群的權限創建 Databricks Repos 的權限

目前這個 Databricks 擴展已經上架Visual Studio Marketplace,同時還托管到了GitHub平臺。支持 Windows(ARM + x64)、Linux(x64 + ARM64)、macOS(Apple Silicon + Intel)。

標簽: Visual studio code,Visual Studio Code,Databricks,攻略,教程