Onze technologietoolstack
Cloud-toolset
Analytische databases: Big Query, Redshift, Synapse
ETL: ZIO, Databricks, DataFlow, DataPrep
Schaalbare Compute Engines: GKE, AKS, EC2, DataProc
Procesorkestratie: AirFlow / Componist, Bat
Platformimplementatie en -schaal: Terraform, aangepaste tools
Open source
Ondersteuning voor alle Hadoop-distributies: Cloudera, Hortonworks, MapR
Hadoop-tools: HDFS, Hive, Pig, Spark, Flink
Geen SQL-databases: Cassandra MongoDB, Hbase, Phoenix
Procesautomatisering : Oozie, luchtstroom
Visualisatietools
Power BI
Tableau
DOMO
Datastudio
D3.js
Programmeervaardigheden
Python: NumPy, Panda’s, Matplotlib, Scikit-Learn, SciPy, Spark, PySpark
Scala, Java, Rusland
SQL, T-SQL, H-SQL, PL/SQL