Interview Questions

Share your experience in working with big data technologies such as Hadoop, Spark, or AWS EMR. How have you leveraged these tools in your previous projects?

Spark/Big Datahardjoinoptimizationpartition0.6 min read

Amazon

→

493

Solve 7-8 data processing questions using PySpark on F1 Racing Data

Spark/Big Datahardjoinoptimizationpartition0.3 min read

McKinsey

→

494

Solve the dataset transformation using PySpark.

Spark/Big Datahardjoinoptimizationpartition0.3 min read

Capgemini

→

495

Solve the grade assignment problem using a UDF in PySpark.

Spark/Big Datahardoptimizationpartitionspark0.4 min read

Capgemini

→

496

Spark Architecture - Components include Driver, Executors, Cluster Manager, and Tasks

Spark/Big Datahardoptimizationpartitionspark2.5 min read

Presidio

→

497

Spark Configurations for Large-Scale Jobs

Spark/Big Datahardoptimizationpartitionspark0.3 min read

Matrix

→

498

Spark Execution Flow - describe

Spark/Big Datahardoptimizationpartitionspark0.4 min read

Matrix

→

499

Spark Executor Management: 10 workers, 100GB RAM, 25 cores - number of executors, size, OOM in Driver

Spark/Big Datahardoptimizationpartitionspark0.4 min read

Meesho

→

500

Spark Optimization - broadcast joins, caching, coalescing, predicate pushdown, AQE

Spark/Big Datahardjoinoptimizationpartition0.3 min read

Lumiq

→

Reading isn't practice. Get AI feedback on your answers.

Type or paste your answer to any of these questions and our AI Coach scores it, highlights gaps, and rewrites it at FAANG quality. Free to try.

Try AI Answer Coach — Free Start a Mock Interview

Previous 1...23 24 25 26 27...34 Next