InfoSphere BigMatch v11.4 for Apache Hadoop
The IBM InfoSphere Big Match on Hadoop course will introduce students to the Probabilistic Matching Engine (PME) and how it can be used to resolve and discover entities across multiple data sets in Hadoop.
Students will learn the basics of a PME algorithm including data model configuration, standardization, comparison and bucketing functions, weight generation, and threshold.
During the exercises, the student will work on a large use case, where they will apply their knowledge of Big Match to discover relationships be two data sets that can be used to understand the full view of the member data.
Målgrupp
The course is designed for a technical audience that will be setting up a custom algorithm for the Probabilistic Matching Engine to use Big Match on Apache Hadoop to compare, match and/or search member records across multiple data sets.
Kursinnehåll
1. Introduction to Big Match for Apache Hadoop
- What is Big Match
- How Big Match Works
- Big Match Components
- Big Match Architecture
2. Big Match Data Model Definition
- Members
- Attribute Types
- Member Attributes
- Sources
- Information Sources
3. PME Algorithm
- Standardization
- Bucketing
- Comparison Functions
4. Bucket Analysis
- Bucket Optimization
- Bucket Concerns
5. Weights
- String Weights
- Numeric Weights
- Multi-dimensional Weights
- Troubleshooting Weights
6. HBase Tables
- HBase concepts
- Big Match commands
- Big Match Tables (.pmebktidx, .pmemdmidx, .pmeentidx)
- Best Practices
7. BigMatch Applications
- PME Derive
- PME Compare
- PME Link
- PME Analysis
Tekniska förkunskapskrav
This course has no pre-requisites.
Investering
Arrow ECS
Arrow ECS Education – Utbildar IT-proffs
Vi erbjuder dig professionella IT-utbildningar från världsledande leverantörer som Check Point, Citrix, F5, IBM, Microsoft, NetApp, Veeam och VMware
Söker du avancerade IT-kurser för att bättre kunna hantera ditt företags IT-miljö?
Då har du kommit rätt!
Arrow ECS har genomfört certifierade IT-utbildningar för konsultbolag och slutanvändare sedan 1992. Vi kan distribution av IT-produkter och tjänster och förstår därmed vilka krav på kunskaper som din verksamhet har. Den tid och budget som du lägger på utbildning ska också ge mätbara resultat i form av effektivitetsökning. Detta kan vi hjälpa dig med.
Arrow ECS Education erbjuder dig:
- Kurser i virtuella klassrum - tryggt och säkert för dig!
- Instruktörer som kan pedagogik och som även arbetar som konsulter
- Öppna schemalagda kurser i vårt kurscenter i Stockholm/Kista
- Företagsinterna kurser hos er och med anpassat innehåll
- Varierade leveranssätt: Klassrum, virtuella klassrum och eLearning
- Certifieringstester via Pearson VUE
På Arrow ECS Education expanderar vi kontinuerligt vår utbildningsportfölj och vi kan i dagsläget erbjuda dig ett omfattande utbildningsprogram av produkt- såväl som generella utbildningar för IT-tekniker/administratörer och utvecklare. Söker du kvalitetskurser inom infrastruktur, virtualisering och nätverk/säkerhet är Arrow ECS ditt självklara val.
Intresseanmälan
Arrow ECS Education – Utbildar IT-proffs
Söker du avancerade IT-kurser för att bättre kunna hantera ditt företags IT-miljö? Då har du kommit rätt! Arrow ECS har genomfört certifierade IT-utbildningar för konsultbolag och slutanvändare sedan 1992. Vi kan distribution av IT-produkter och tjänster och förstår därmed vilka krav...