Feature Engineering and Data Preparation for Analytics

Kód kurzu: DMDP42

Táto časť nie je lokalizovaná

This course introduces programming techniques to craft and feature engineer meaningful inputs to improve predictive modeling performance. In addition, this course provides strategies to preemptively spot and avoid common pitfalls that compromise the integrity of the data being used to build a predictive model. This course relies heavily on SAS programming techniques to accomplish the desired objectives.

The self-study e-learning includes:

  • Annotatable course notes in PDF format.
  • Virtual Lab time to practice.

Odborní
certifikovaní lektori

Mezinárodne
uznávané certifikácie

Široká ponuka technických
a soft skills kurzov

Skvelý zákaznicky
servis

Prispôsobenie kurzov
presne na mieru

Termíny kurzov

Počiatočný dátum: Na vyžiadanie

Forma: E-learning

Dĺžka kurzu: 21 hodín

Jazyk: en

Cena bez DPH: 1 080 EUR

Registrovať

Počiatočný dátum: Na vyžiadanie

Forma: Na vyžiadanie

Dĺžka kurzu: 21 hodín

Jazyk: en

Cena bez DPH: 1 800 EUR

Registrovať

Počiatočný
dátum
Miesto
konania
Forma Dĺžka
kurzu
Jazyk Cena bez DPH
Na vyžiadanie E-learning 21 hodín en 1 080 EUR Registrovať
Na vyžiadanie Na vyžiadanie 21 hodín en 1 800 EUR Registrovať
G Garantovaný kurz

Nenašli ste vhodný termín?

Napíšte nám o vypísanie alternatívneho termínu na mieru.

Kontakt

Cieľová skupina

Táto časť nie je lokalizovaná

Analysts, data scientists, and IT professionals looking to craft better inputs to improve predictive modeling performance

Štruktúra kurzu

Táto časť nie je lokalizovaná

Extracting Relevant Data

  • Data difficulties.
  • Assessing available data.
  • Accessing available data.
  • Drawing a representative target sample.
  • Drawing an uncontaminated input sample.

Transforming Transaction and Event Data

  • Advantages and disadvantages of transactions data.
  • Common transaction structures.
  • Defining the time horizon.
  • Fixed and variable time horizon methods.
  • Implementing common transaction transformations.

Using Nonnumeric Data

  • Definitions and difficulties of nonnumeric data.
  • Miscoding and multicoding detection.
  • Controlling degrees of freedom.
  • Geocoding.

Managing Data Pathologies

  • Exploring input variable distributions.
  • Detecting data anomalies.
  • Creating custom exploratory tools for candidate input variables.
  • Missing value imputation.
  • Data partitioning.

Predpokladané znalosti

Táto časť nie je lokalizovaná

This course assumes some experience in both predictive modeling and SAS programming. Before attending this course, you should have:
  • Exposure to DATA step programming equivalent to the SAS Programming 1: Essentials course.
  • Exposure to programming in SQL or the SQL procedure.
  • Exposure to querying data in PROC SQL and building and deploying a predictive model.
  • Familiarity with the analytical process of building predictive models and scoring new data.
  • Potrebujete poradiť alebo upraviť kurz na mieru?

    pruduktová podpora