10:[["$","$L123",null,{"props":{"lessonContent":{"components":[{"type":"SlateHTML","content":{"html":"

To better illustrate how dangerous reidentification is, we examine a relevant example in the financial context. We’ll take the recent Experian data breaches as inspiration.

Setup

Imagine we have three datasets—the Netflix ratings dataset (made public for research/competitions), the IMDb ratings dataset (always public), and credit data from Experian (obtained and released through a major data ...

","comp_id":"RapssjczXGcl5hXcqEQ3i"},"hash":0,"iteration":0}],"summary":{"titleUpdated":true,"title":"Reidentification Example","description":"Learn how attackers can reidentify using leaked data."},"content":[{"type":"SlateHTML","content":{"html":"

To better illustrate how dangerous reidentification is, we examine a relevant example in the financial context. We’ll take the recent Experian data breaches as inspiration.

Setup

","comp_id":"RapssjczXGcl5hXcqEQ3i"},"hash":0,"iteration":0}],"darkModeContent":[{"type":"SlateHTML","content":{"html":"

To better illustrate how dangerous reidentification is, we examine a relevant example in the financial context. We’ll take the recent Experian data breaches as inspiration.

Setup

","comp_id":"RapssjczXGcl5hXcqEQ3i"},"hash":0,"iteration":0}]},"isPreviewLesson":false,"pageType":"collection_lesson","aiCoachVideoUrl":"https://youtu.be/kgl8y9J3O6c","collectionDetailsSSR":{"title":"Mitigating Disasters in ML Pipelines","summary":"$124","details":"","clos":["The ability to understand, identify, and fix potential problems with machine learning (ML) pipelines","An understanding of issues in data and model privacy, as well as malicious attacks","A working knowledge of the dangers of large language models (LLMs)","An understanding of how to mitigate risks associated with ML pipelines"],"arabic_available":false,"toc":{"categories":[{"id":"vrsz3ihsg","title":"Introduction","pages":[{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6126927887466496,"id":6126927887466496,"title":"Introduction","is_preview":true,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","is_lesson":true,"slug":"introduction"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":4955693676494848,"id":4955693676494848,"title":"The Standard ML Pipeline","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"the-standard-ml-pipeline"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5893638323437568,"id":5893638323437568,"title":"Sources of Disasters","is_preview":true,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","is_lesson":true,"slug":"sources-of-disasters"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5967449846185984,"id":5967449846185984,"title":"Quiz: ML Pipeline and Sources of Disasters","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-ml-pipeline-and-sources-of-disasters"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Get familiar with mitigating faults in ML pipelines, understanding biases, and ensuring data integrity."},{"id":"61x71o3tb","title":"Disasters in Data","pages":[{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5871887669526528,"id":5871887669526528,"title":"Introduction to Data Bias","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"introduction-to-data-bias"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5298712715984896,"id":5298712715984896,"title":"Diagnosing Data Bias","is_preview":true,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","is_lesson":true,"slug":"diagnosing-data-bias"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":4598003959857152,"id":4598003959857152,"title":"Theory of Data Bias Mitigation","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"theory-of-data-bias-mitigation"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5735499405983744,"id":5735499405983744,"title":"Practice of Data Bias Mitigation","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"practice-of-data-bias-mitigation"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6640099923329024,"id":6640099923329024,"title":"Case Study: COMPAS in US Justice System","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"case-study-compas-in-us-justice-system"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6460868387930112,"id":6460868387930112,"title":"Data Drift","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"data-drift"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":4844253560963072,"id":4844253560963072,"title":"Detecting Data Drift","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"detecting-data-drift"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":4638551840129024,"id":4638551840129024,"title":"Data Privacy","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"data-privacy"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5894884576985088,"id":5894884576985088,"title":"Reidentification Example","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"reidentification-example"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6091734202449920,"id":6091734202449920,"title":"Theory of Ensuring Data Privacy","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"theory-of-ensuring-data-privacy"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6270220661686272,"id":6270220661686272,"title":"Ensuring Data Privacy in Practice","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"ensuring-data-privacy-in-practice"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":4704298704568320,"id":4704298704568320,"title":"Quiz: Disasters in Data","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"quiz-disasters-in-data"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Solve challenges with mitigating data and privacy biases, detecting drift, and safeguarding data."},{"id":"haovobzue","title":"Disasters in Models","pages":[{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5848771274735616,"id":5848771274735616,"title":"Understanding Model Bias","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"understanding-model-bias"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5602612924907520,"id":5602612924907520,"title":"Large Language Models","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"large-language-models"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6084593701879808,"id":6084593701879808,"title":"Post-Training Model Bias Mitigation","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"post-training-model-bias-mitigation"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6546935438901248,"id":6546935438901248,"title":"In-Training Model Bias Mitigation","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"in-training-model-bias-mitigation"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":4711566930083840,"id":4711566930083840,"title":"Adversarial Attacks","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"adversarial-attacks"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":4539584217350144,"id":4539584217350144,"title":"Thwarting Adversarial Attacks","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"thwarting-adversarial-attacks"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":4780274729877504,"id":4780274729877504,"title":"Other Model Attacks","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"other-model-attacks"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":4695119109554176,"id":4695119109554176,"title":"Intro to Model Explainability","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"intro-to-model-explainability"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6704169158443008,"id":6704169158443008,"title":"Explainability Methods","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"explainability-methods"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5057229924597760,"id":5057229924597760,"title":"Adversarial Attacks on Explanations","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"adversarial-attacks-on-explanations"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5195874522365952,"id":5195874522365952,"title":"Case Study: Chest X-rays","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"case-study-chest-x-rays"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6579777992130560,"id":6579777992130560,"title":"Quiz: Disasters in Models","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-disasters-in-models"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Examine model biases, adversarial vulnerabilities, explainability challenges, and mitigation strategies."},{"page_id":4956927595118592,"id":6747599947563008,"title":"Measuring Causal Relations with Python","pages":[],"editMode":false,"type":"PATH_EXTERNAL_PROJECT","author_id":6586453712175104,"collection_id":4940086189490176,"is_required":false,"detail_id":"project_6586453712175104_4940086189490176_4956927595118592","cover_image_serving_url":null,"collection_read_time":0,"page_count":0,"brief_summary":null,"course_url_slug":null,"assessments_keys":[],"projects_keys":[],"optional_lessons":[],"time_limit":null},{"id":"ooxm4ydo9","title":"Alternatives to Traditional ML","pages":[{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5700320109002752,"id":5700320109002752,"title":"Federated Learning","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"federated-learning"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6724069184765952,"id":6724069184765952,"title":"Causal AI","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"causal-ai"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5367472137699328,"id":5367472137699328,"title":"Online Learning","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"online-learning"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":6509784055676928,"id":6509784055676928,"title":"Neurosymbolic AI","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"neurosymbolic-ai"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5343245431996416,"id":5343245431996416,"title":"Generative AI","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"generative-ai"},{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5021135048278016,"id":5021135048278016,"title":"Quiz: Alternatives to Traditional ML","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-alternatives-to-traditional-ml"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Break down complex ideas in federated learning, causal AI, online learning, neurosymbolic AI, and generative AI."},{"page_id":6175596564185088,"id":5420221010935808,"title":"Adversarial Robustness of Neural Networks","pages":[],"editMode":false,"type":"PATH_EXTERNAL_PROJECT","author_id":6586453712175104,"collection_id":4567056619667456,"is_required":false,"detail_id":"project_6586453712175104_4567056619667456_6175596564185088","cover_image_serving_url":null,"collection_read_time":0,"page_count":0,"brief_summary":null,"course_url_slug":null,"assessments_keys":[],"projects_keys":[],"optional_lessons":[],"time_limit":null},{"id":"5gmeugc1p","title":"Conclusion","pages":[{"author_id":6586453712175104,"collection_id":5913417620914176,"page_id":5926972005548032,"id":5926972005548032,"title":"Final Thoughts","is_preview":false,"parentIndex":null,"editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"final-thoughts"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Ensure safety and trust in evolving ML pipelines with vigilant governance and transparency."},{"id":6698355126960128,"title":"Assessment: Disasters in ML Pipelines","pages":[],"editMode":false,"type":"COLLECTION_ASSESSMENT","slug":"assessment-disasters-in-ml-pipelines"}]},"page_titles":{"4955693676494848":"The Standard ML Pipeline","5893638323437568":"Sources of Disasters","5871887669526528":"Introduction to Data Bias","4598003959857152":"Theory of Data Bias Mitigation","6640099923329024":"Case Study: COMPAS in US Justice System","6460868387930112":"Data Drift","4844253560963072":"Detecting Data Drift","4638551840129024":"Data Privacy","6091734202449920":"Theory of Ensuring Data Privacy","4704298704568320":"Quiz: Disasters in Data","5848771274735616":"Understanding Model Bias","6084593701879808":"Post-Training Model Bias Mitigation","4711566930083840":"Adversarial Attacks","5195874522365952":"Case Study: Chest X-rays","4780274729877504":"Other Model Attacks","4695119109554176":"Intro to Model Explainability","5735499405983744":"Practice of Data Bias Mitigation","6270220661686272":"Ensuring Data Privacy in Practice","5700320109002752":"Federated Learning","6724069184765952":"Causal AI","6509784055676928":"Neurosymbolic AI","4539584217350144":"Thwarting Adversarial Attacks","5602612924907520":"Large Language Models","5057229924597760":"Adversarial Attacks on Explanations","6546935438901248":"In-Training Model Bias Mitigation","5894884576985088":"Reidentification Example","5298712715984896":"Diagnosing Data Bias","6704169158443008":"Explainability Methods","6126927887466496":"Introduction","5967449846185984":"Quiz: ML Pipeline and Sources of Disasters","6579777992130560":"Quiz: Disasters in Models","5343245431996416":"Generative AI","5021135048278016":"Quiz: Alternatives to Traditional ML","6698355126960128":"Assessment: Disasters in ML Pipelines","5367472137699328":"Online Learning","6108514294169600":null,"6170697568878592":null,"5083843679485952":null,"5877315969744896":null,"5909619861618688":null,"5648689726750720":null,"6464099803987968":null,"6577586228166656":null,"4995549016883200":null,"6429469818224640":null,"5926972005548032":"Final Thoughts"},"page_tags":{"6126927887466496":"","4955693676494848":"","5893638323437568":"","5871887669526528":"","5298712715984896":"","4598003959857152":"","5735499405983744":"","6460868387930112":"","6640099923329024":"","5967449846185984":"","4844253560963072":"","4638551840129024":"","5894884576985088":"","6091734202449920":"","6270220661686272":"","5848771274735616":"","4704298704568320":"","5602612924907520":"","6084593701879808":"","6546935438901248":"","4711566930083840":"","4539584217350144":"","4780274729877504":"","4695119109554176":"","6704169158443008":"","5057229924597760":"","6579777992130560":"","5195874522365952":"","6698355126960128":"","5700320109002752":"","6724069184765952":"","6509784055676928":"","5367472137699328":"","5343245431996416":"","5021135048278016":"","6108514294169600":"","6170697568878592":"","5083843679485952":"","5877315969744896":"","5909619861618688":"","5648689726750720":"","6464099803987968":"","6577586228166656":"","4995549016883200":"","6429469818224640":"","5926972005548032":""},"collection_toc_is_enabled":true,"page_count":null,"docker":{"container":{"file":{},"imageName":"","buildStatusUrl":"","buildLogUrl":"","track":false},"envs":[],"jobs":[],"testRunners":[],"version":3,"loaded":true},"discounted_price":29,"cover_image_id":5182278143311872,"cover_image_metadata":"{\"width\":1024,\"height\":512,\"sizeInBytes\":39469,\"name\":\"Disaster-Proofing Machine Learning Pipelines.png\"}","cover_image_serving_url":"/v2api/collection/6586453712175104/5913417620914176/image/5182278143311872","tags":[],"intro_video_url":"","intro_video_thumbnail_url":"","aggregated_widget_stats":{"projects":0,"assessments":1,"SlateHTML":121,"codeExerciseCount":0,"codeRunnableCount":16,"codeSnippetCount":0,"illustrations":51,"DrawIOWidget":49,"Table":4,"Image":1,"Code":16,"Latex":19,"Quiz":4,"Notepad":0,"cloudlabs":0,"Columns":1},"default_themes":{"code_themes":{"Code":"default","Markdown":"default","RunJS":"default","SPA":"default","isForced":{"Code":false,"Markdown":false,"RunJS":false,"SPA":false}}},"api_keys":{"api_keys":[]},"skills":["Machine Learning","Data Science","Data Pipeline Engineering","Natural Language Processing"],"testimonials":[],"licensing":null,"target_audience":"advanced","author_id":"6586453712175104","collection_id":"5913417620914176","approval_status":3005,"price":29,"is_private":false,"path_type":"regular","organization_id":null,"is_mini":false,"is_priced":true,"brief_summary":"Learn about ML pipeline risk management data, bias, and security. Explore data privacy, attacks, and AI alternatives like causal AI and federated learning.","approval_update_time":"2023-11-14T10:48:34.901Z","rating_visibility":true,"update_last_published_on_homepage":true,"show_developed_by":true,"udata_files":[],"CodeThemes":{"Code":"default","Markdown":"default","RunJS":"default","SPA":"default","isForced":{"Code":false,"Markdown":false,"RunJS":false,"SPA":false}},"is_marked_for_deletion":false,"transition_page_title":"","is_redirectable":false,"collection_type":"collection","adaptive_learning_mode":false,"HLOs_to_toc":{},"is_guide":false,"read_time":28800,"allow_logged_out_executions":false,"unique_live_widget_urls":false,"metadata_status":101,"is_collection_palified":false},"pageSummarySSR":{"title":"Reidentification Example","description":"Learn how attackers can reidentify using leaked data.","discourse_page_url":"https://discuss.educative.io/tag/reidentification-example__disasters-in-data__mitigating-disasters-in-ml-pipelines?open=true&ctag=mitigating-disasters-in-ml-pipelines__abhinav-raghunathan&cslug=mitigating-disasters-in-ml-pipelines&pslug=reidentification-example"},"adaptiveLearningConfigConstantSSR":0,"enableLessonPageLockedBannerV2":true,"allowAllLessonPreview":false,"lockedBannerStatsSSR":{"b2cTrialStats":{"is_b2c_trial_active":true,"b2c_trial_active_duration":7,"b2c_trial_categories":"$125"},"b2cStatus":100,"learnerTags":"$126","workStats":1450,"interviewWorksStats":78,"inL2cStarterPack":false,"l2cWorkStats":43,"enableL2cStarterPackPaymentWidget":"true"},"pageTocSSR":"

","authorId":"6586453712175104","collectionId":"5913417620914176","pageId":"5894884576985088","isCollectionPageLockedCachingEnabled":true,"aceFeatureFlags":{"enableAceEditor":true,"enableAceEditorForAnswers":true},"meta":{"type":["Article","TechArticle"],"title":"Reidentification Example","name":"Mitigating Disasters in ML Pipelines","description":"Learn how attackers can reidentify using leaked data.","image":"https://educative.io/api/collection/6586453712175104/5913417620914176/image/5182278143311872.png","isAccessibleForFree":false,"keywords":"$126","provider":"Educative","publisher":"Educative","id":"courses/mitigating-disasters-in-ml-pipelines/reidentification-example","author":"Educative","educationalLevel":"advanced","noIndex":true,"isForcedNoIndex":true,"noFollow":false,"redirectInfo":{"isDeletedCollectionPageRedirectable":false},"page_titles":"$127","is_marked_for_deletion":false,"transition_page_title":"","is_redirectable":false,"deleted_course_lesson_redirect":{"author_id":null,"collection_id":null,"page_id":null,"redirect_url_slug":null},"metadata_status":101,"additional_course_alternatives":[]},"requestUrl":"/courses/mitigating-disasters-in-ml-pipelines/reidentification-example","requestUrlInfo":{"authorId":"6586453712175104","collectionId":"5913417620914176","pageId":"5894884576985088","courseUrlSlug":"mitigating-disasters-in-ml-pipelines","pageUrlSlug":"reidentification-example"},"isExternalContent":false}}],[["$","script",null,{"id":"generate-data","type":"application/ld+json","dangerouslySetInnerHTML":{"__html":"$128"}}],false,"$undefined"]]