Microsoft DP-600 (Fabric Analytics Engineer Associate)1-10

回答
(下記画像参照)

partitionBy(“year”,”month”,”day”) を指定すると、Spark は列値ごとに year、month、day の フォルダー階層を作成 してファイルを書き込みます。
パーティション単位でファイルを分けるため、分散環境では複数ノードで並列に読み取ることができます。
一方、コードでは圧縮オプションを指定していないため、圧縮利用はこの記述だけでは判断できません
したがって 3 つ目は「いいえ」です。
Spark を使用したレイクハウスへのデータ ストリーミング – Microsoft Fabric

A. optimize コマンドを実行し、v-order パラメーターを指定する。
B. OPTiMize コマンドを実行し、z-order パラメーターを指定する。
C. vacuum コマンドを実行する。
D. OneLake ファイル エクスプローラーからファイルを削除する。

回答
C. vacuum コマンドを実行する。

Delta テーブルで参照されなくなった古いファイルを安全に削除するには、VACUUM コマンド を使用します。
VACUUM は Delta ログで参照されていないファイルを、保持期間の条件に従って削除するため、トランザクション ログの整合性 と ACID 特性を維持できます。
OPTIMIZE や V-Order は読み取り効率やファイル配置の最適化が目的であり、不要ファイル削除の主目的ではありません。
OneLake ファイル エクスプローラーで直接削除すると Delta ログと不整合 になる可能性があります。
Lakehouse で Delta テーブルのメンテナンスを実行する

A. HR マネージャーに、Microsoft Power BI Desktop でレポートを開くよう依頼する。
B. [ロールとしてテスト] を選択して、HR ロールとしてデータを表示する。
C. [ロールとしてテスト] を選択して、HR マネージャーとしてレポートを表示する。
D. HR 部門のフィルターの意図したロジックに一致するように、レポート内のデータをフィルター処理する。

回答
C. [ロールとしてテスト] を選択して、HR マネージャーとしてレポートを表示する。

動的 RLS では、USERPRINCIPALNAME() などに基づき、ユーザーごとに表示される行が変わります。
そのため HR ロールだけで確認しても、特定の HR マネージャーに割り当てられた部門データを正しく検証できません。
Power BI サービスの ロールとしてテスト では、ロールや 特定のユーザー として表示を確認できます。
今回確認すべきなのは報告者本人に見える内容なので、HR マネージャーとしてレポートを表示する操作が 正答 です。
Power BI での行レベルのセキュリティ (RLS) – Microsoft Fabric | Microsoft Learn

A. はい
B. いいえ

回答
A. はい

DESCRIBE HISTORY は、Delta テーブルの操作レベルの履歴を返す読み取り専用コマンドです。
履歴には WRITE、MERGE、OPTIMIZE、VACUUM などの操作、実行時刻、ユーザー、操作メトリックが含まれます。
そのため Customer に対して メンテナンスが実行済みか確認 できます。
今回の目的は性能改善の実行ではなく、実施有無の識別です。
したがって DESCRIBE HISTORY customer は要件を満たします。
Inspect Delta table metadata – Microsoft Fabric | Microsoft Learn

回答
(下記画像参照)

Fabric Warehouse のストアド プロシージャは T-SQL で作成でき、AS の後に処理本体を記述します。
通常の処理ブロックを開始するには BEGIN を使用します。
分散トランザクションを開始する必要はなく、SET は処理ブロックの開始ではありません。
重複排除は PersonID、FirstName、LastName の一意な組み合わせを返せばよいため、SELECT の直後には DISTINCT を指定します。
GROUP BY でも似た結果は得られますが、集計しない重複排除では SELECT DISTINCT が最も適切です。
チュートリアル: ウェアハウス内のストアド プロシージャを使用してデータを変換する

A. はい
B. いいえ

回答
B. いいえ

df.show() は Spark DataFrame の内容を画面に表示するためのメソッドであり、列ごとの統計値を計算する処理ではありません。
求められているのは最小値、最大値、平均、標準偏差などの 記述統計の算出 です。
Fabric ノートブックでは display(df, summary = true) などにより DataFrame の統計概要を確認できます。
したがって、単に df.show() を実行しても、目標は満たされません
Microsoft Fabric でのノートブックの視覚化

A. セマンティック モデルにマスター データの承認を適用する。
B. セマンティック モデルに認定済みの承認を適用する。
C. ワークスペース ID を作成する。
D. セマンティック モデルとレポートに秘密度ラベルを適用する。

回答
D. セマンティック モデルとレポートに秘密度ラベルを適用する。

Microsoft Purview の DLP ポリシーを Fabric や Power BI の項目に適用するには、対象コンテンツを分類するための 秘密度ラベル が重要です。
秘密度ラベルはセマンティック モデルやレポートなどに適用でき、DLP ポリシーの条件として利用されます。
承認や認定は検出性や信頼性を高める機能であり、DLP の適用条件 にはなりません。
ワークスペース ID も外部リソース接続用であり、本要件とは無関係です。
したがって セマンティック モデルとレポートへ秘密度ラベルを適用 します。
Power BI の秘密度ラベル – Microsoft Purview Information Protection | Microsoft Learn

A. 列の品質の詳細を表示する。
B. 詳細ウィンドウに列プロファイルを表示する。
C. 詳細ウィンドウを有効にする。
D. 列値の分布を表示する。
E. 列プロファイルを有効にする。

回答
B. 詳細ウィンドウに列プロファイルを表示する。
C. 詳細ウィンドウを有効にする。
E. 列プロファイルを有効にする。

Power Query のデータ プロファイリングでは、列の品質、列の分布、列プロファイルを確認できます。
最小値や最大値などの統計情報を列単位で確認するには、まず 列プロファイルを有効化 し、結果を表示するために 詳細ウィンドウを有効化 します。
さらに詳細ウィンドウに列プロファイルを表示することで、各列の統計情報を確認できます。
列の品質は有効・空・エラーの割合、列の分布は値の分布確認が中心であり、最小値と最大値の確認には不十分です。
データ プロファイリング ツールの使用 – Power Query

A. ドメイン管理者
B. ドメイン共同作成者
C. ワークスペース管理者
D. Fabric 管理者

回答
D. Fabric 管理者

Fabric ドメインでは、新しいドメインの作成 は Fabric 管理者のみが実行できます。
ドメイン管理者は、自分が管理者である既存ドメインのサブドメイン作成やワークスペース割り当ては可能ですが、新規ドメインの作成権限までは持ちません。
ドメイン共同作成者は主に自分が管理者であるワークスペースを既存ドメインへ割り当てる役割であり、ワークスペース管理者もドメイン管理権限ではありません。
したがって、要件全体を満たす最小の選択肢は Fabric 管理者 です。
ドメイン – Microsoft Fabric | Microsoft Learn

表1
表2
回答
(下記画像参照)

PeriodDate は OrderDate の年月を使い、日を 1 に固定した日付を返す必要があるため、DATEFROMPARTS が適切です。
DATEPART は数値の一部を返す関数で、DATETRUNC や DATE_BUCKET はこの設問のコード形式とは一致しません。
DayName は曜日名を返す必要があるため、DATENAME の datepart には weekday を指定します。
day や dayofyear は日や通算日を返す指定であり、曜日名にはなりません。
したがって、DATEFROMPARTS と weekday を選択します。
日付と時刻のデータ型および関数 (Transact-SQL)