P-087: 顧客データ(df_customer)では、異なる店舗での申込みなどにより同一顧客が複数登録されている。名前(customer_name)と郵便番号(postal_cd)が同じ顧客は同一顧客とみなして1顧客1レコードとなるように名寄せした名寄顧客データを作成し、顧客データの件数、名寄顧客データの件数、重複数を算出せよ。ただし、同一顧客に対しては売上金額合計が最も高いものを残し、売上金額合計が同一もしくは売上実績がない顧客については顧客ID(customer_id)の番号が小さいものを残すこととする。
P-088: 087で作成したデータを元に、顧客データに統合名寄IDを付与したデータを作成せよ。ただし、統合名寄IDは以下の仕様で付与するものとする。
・重複していない顧客:顧客ID(customer_id)を設定
・重複している顧客:前設問で抽出したレコードの顧客IDを設定顧客IDのユニーク件数と、統合名寄IDのユニーク件数の差も確認すること。
この二つめちゃくちゃ難しかった、、、何だろうはまった、、、
考え方としては
ダブっている人を抜かしたリストを作る。(名寄席顧客データ)
それと元の顧客リストを名前と郵便番号で内部結合すると。
そうするとダブった人のところにも残す人のcustomer_idが入ると。
難しくなさそうなのになんかはまった・・・