Onze technologietoolstack

Cloud-toolset

Analytische databases: Big Query, Redshift, Synapse
ETL: ZIO, Databricks, DataFlow, DataPrep
Schaalbare Compute Engines: GKE, AKS, EC2, DataProc
Procesorkestratie: AirFlow / Componist, Bat
Platformimplementatie en -schaal: Terraform, aangepaste tools

Open source

Ondersteuning voor alle Hadoop-distributies: Cloudera, Hortonworks, MapR
Hadoop-tools: HDFS, Hive, Pig, Spark, Flink
Geen SQL-databases: Cassandra MongoDB, Hbase, Phoenix
Procesautomatisering : Oozie, luchtstroom

Visualisatietools

Power BI
Tableau
DOMO
Datastudio
D3.js

Programmeervaardigheden

Python: NumPy, Panda’s, Matplotlib, Scikit-Learn, SciPy, Spark, PySpark
Scala, Java, Rusland
SQL, T-SQL, H-SQL, PL/SQL