Databricks Databricks-Certified-Data-Engineer-Associate日本語 실제 시험문제 및 답변

문제1
データエンジニアがノートブック上で小規模な概念実証を開発している。ノートブック全体を実行すると、クラスタの使用率が急上昇する。データエンジニアは、開発環境を維持しつつ、リアルタイムの結果を得たいと考えている。
これらの要件を満たすクラスターはどれですか？

A. 自動スケーリング機能を備えた汎用クラスタ

B. 大容量の固定メモリを備えた汎用クラスタ

C. 自動スケーリングが有効になっているジョブクラスタ

D. Photonが有効化され、オートスケーリング機能を備えたジョブクラスタ

정답: A

설명: (ExamPassdump 회원만 볼 수 있음)

문제2
データアーキテクトは、以下の形式のテーブルが必要であると判断しました。

次のコードブロックのうち、既に同じ名前のテーブルが存在するかどうかに関わらず、上記の形式で空のデルタテーブルを作成するためにSQL DDLコマンドを使用するものはどれですか？

A. 選択肢D

B. オプションA

C. オプションC

D. オプションB

E. オプションE

정답: E

설명: (ExamPassdump 회원만 볼 수 있음)

문제3
データエンジニアがワークスペースUIを使用して、複数のDatabricksジョブとダッシュボードを手動で作成しました。チームは今後、これらのリソースを宣言型自動化バンドル(旧Databricksアセットバンドル)を使用してコードとして管理し、構成をGitリポジトリに保存し、CI/CDを通じて変更をデプロイしたいと考えています。
既存のリソースをバンドルプロジェクトに変換するには、どの方法が有効ですか？

A. Databricks REST API を使用して各ジョブの JSON 定義をエクスポートし、JSON ファイルを Git リポジトリに保存し、各デプロイ時に REST API を使用してそれらをインポートするように CI/CD を構成します。

B. databricks bundle init を実行して新しいバンドルプロジェクトを作成し、次に databricks bundle deploy を使用して既存のワークスペースリソースをすべて自動的に検出してインポートします。

C. 既存のリソースごとに databricks bundle generate を実行し、次に databricks bundle deployment bind を使用して生成された構成を対応する既存のワークスペースリソースにリンクし、バンドルプロジェクトを Git にコミットして CI/CD デプロイメントを行います。

D. 空の Git リポジトリを Git フォルダーにクローンし、ワークスペース UI を参照して YAML で各ジョブとダッシュボード構成を手動で再作成してから、databricks bundle deploy を使用してデプロイします。

정답: C

문제4
データエンジニアは、テーブルから読み取り、データを操作し、新しいテーブルにストリーミング書き込みを実行するように構造化ストリーミングジョブを構成しました。
データエンジニアが使用するコードブロックは次のとおりです。

データエンジニアが、クエリで利用可能なすべてのデータを必要な数のバッチで処理することだけを望む場合、データエンジニアは空白を埋めるために次のどのコード行を使用する必要がありますか。

A. 処理時間(1)

B. トリガー(availableNow=True)

C. トリガー(処理時間="1回")

D. トリガー(連続="1回")

E. トリガー(parallelBatch=True)

정답: B

설명: (ExamPassdump 회원만 볼 수 있음)

문제5
データエンジニアは、Python 変数 day_of_week が 1 で、Python 変数 review_period が True の場合にのみ、Python プログラムの最後のブロックを実行したいと考えています。
データエンジニアは、この条件付きで実行されるコードブロックを開始するために、次のどの制御フローステートメントを使用する必要がありますか?

A. day_of_week = 1 かつ review_period = "True" の場合:

B. day_of_week == 1 かつ review_period == "True" の場合:

C. day_of_week = 1 かつ review_period の場合:

D. day_of_week == 1 かつ review_period の場合:

E. day_of_week = 1 & review_period: = "True"の場合:

정답: D

설명: (ExamPassdump 회원만 볼 수 있음)

문제6
エンジニアリングマネージャーは、Databricks SQLクエリを使用して、最近のプロジェクトのパフォーマンスを監視したいと考えています。プロジェクトのリリース後1週間は、クエリ結果を1分ごとに更新したいと考えています。しかし、クエリに使用されるコンピューティングリソースが稼働し続け、プロジェクトリリース後1週間を過ぎても組織に多大なコストがかかることを懸念しています。
プロジェクトのリリース後 1 週間を過ぎてもクエリによって組織にコストが発生しないようにするために、エンジニアリングチームが使用できるアプローチは次のどれですか。

A. プロジェクトのリリース後 1 週間を過ぎても、クエリによって組織にコストが発生しないことを保証できません。

B. クエリスケジューラで、クエリの更新スケジュールを特定の日付に終了するように設定できます。

C. SQL エンドポイントによって消費される DBU の数に制限を設定できます。

D. クエリの更新スケジュールを、一定回数の更新後に終了するように設定できます。

E. クエリの更新スケジュールを管理できるユーザーの数に制限を設定できます。

정답: B

설명: (ExamPassdump 회원만 볼 수 있음)

문제7
データエンジニアは、データパイプラインの一部として Delta テーブルを使用する必要がありますが、適切な権限があるかどうかがわかりません。
データエンジニアがテーブルに対する権限を確認できるのは次のどの場所ですか。

A. ダッシュボード

B. データエクスプローラー

C. ジョブ

D. 休憩

E. Databricks ファイルシステム

정답: B

설명: (ExamPassdump 회원만 볼 수 있음)

문제8
データエンジニアとデータアナリストがデータパイプラインを共同で開発しています。データエンジニアはPythonを使用してパイプラインのraw、bronze、silverレイヤーを担当し、データアナリストはSQLを使用してパイプラインのgoldレイヤーを担当しています。パイプラインのrawソースはストリーミング入力です。彼らは現在、パイプラインをDelta Live Tablesを使用するように移行したいと考えています。
Delta Live Tablesへの移行時に、パイプラインにどのような変更が必要になりますか？

A. パイプラインでは、ストリーミングソースの代わりにバッチソースを使用する必要があります。

B. パイプラインは、SQLとPythonの異なるノートブックソースを持つことができます。

C. パイプラインはすべてPythonで記述する必要があります。

D. パイプラインはすべてSQLで記述する必要があります。

정답: B

설명: (ExamPassdump 회원만 볼 수 있음)

문제9
データエンジニアが単一ノードクラスターを使用するシナリオを説明しているのは次のどれですか。

A. できるだけ早く更新される自動レポートを実行している場合

B. 少量のデータを使って対話的に作業しているとき

C. 大規模なデータに自動的にスケールする能力について懸念がある場合

D. 大量のデータを含むレポートを手動で実行する場合

E. Databricks SQL内でSQLを操作している場合

정답: B

설명: (ExamPassdump 회원만 볼 수 있음)

문제10
次のコマンドのうち、member_id 列の null 値の数を返すものはどれですか。

A. my_table から count(member_id) - count_null(member_id) を選択します。

B. my_table から count(member_id) を選択します。

C. my_table から null(member_id) を選択します。

D. count_if(member_id IS NULL) を my_table から選択します。

E. count_null(member_id) を my_table から選択します。

정답: D

설명: (ExamPassdump 회원만 볼 수 있음)

문제11
データエンジニアリングチームは、以下の機能を備えたSaaSアプリケーションからDatabricksデータインテリジェンスプラットフォームに顧客トランザクションを段階的に取り込む必要があります。
更新や削除を含む変更データの取得機能が組み込まれています。
自動的なスキーマ進化
再試行機能と最小限のメンテナンスを備えたサーバーレス実行
OAuthサポートと基本的な監視
どのソリューションがすべての要件を満たしていますか？

A. Lakeflow Connect マネージドコネクタを使用して、組み込みの CDC、スキーマ進化、OAuth、および再試行機能を備えたサーバーレスコンピューティングを SaaS アプリケーションに提供し、Lakeflow Spark Declarative Pipelines を使用してデータを下流で処理します。

B. SaaS REST API を呼び出し、カスタム CDC およびスキーマ進化ロジックを使用して Silver テーブルに直接書き込むリージョンバッチジョブをスケジュールします。

C. エクスポートされたSaaSファイルに対してAuto Loaderを使用し、SaaS APIを呼び出し、カスタムコードでCDC、スキーマ変更、OAuth、および再試行を処理するLakeflow Spark Declarative Pipelineを使用します。

D. Lakeflow Connect 標準コネクタを使用し、ワークフローで MERGE ベースの CDC、スキーマ進化、および再試行を実装し、専用の監視ダッシュボードを作成します。

정답: A

설명: (ExamPassdump 회원만 볼 수 있음)

최신Databricks Certified Data Engineer Associate Exam (Databricks-Certified-Data-Engineer-Associate日本語版) - Databricks-Certified-Data-Engineer-Associate日本語무료샘플문제

자격증의 중요성:

ExamPassdump 제품의 가치:

무료샘플 받아보기:

완벽한 서비스 제공: