DataEngPrep.tech

JavaScript is required to use this application. Please enable JavaScript in your browser settings or disable any extensions that may be blocking scripts.

DataEngPrep.tech

Questions Practice AI Coach Dashboard Packs Blog

Interview Questions

Real questions from top companies in Spark/Big Data · hard

700+ Easy450+ Medium650+ Hard

All Categories Behavioral Spark/Big Data SQL Python/Coding System Design/Architecture Cloud/Tools General/Othereasy medium hard

Schema evolution - techniques for handling schema changes in PySpark

Spark/Big Datahardoptimizationpartitionspark0.4 min read

Setting Dependencies for Tasks in DAG

Spark/Big Datahardairflowoptimizationpartition0.3 min read

Share your experience in working with big data technologies such as Hadoop, Spark, or AWS EMR. How have you leveraged these tools in your previous projects?

Spark/Big Datahardjoinoptimizationpartition0.6 min read

Solve 7-8 data processing questions using PySpark on F1 Racing Data

Spark/Big Datahardjoinoptimizationpartition0.3 min read

Solve the dataset transformation using PySpark.

Spark/Big Datahardjoinoptimizationpartition0.3 min read

Solve the grade assignment problem using a UDF in PySpark.

Spark/Big Datahardoptimizationpartitionspark0.4 min read

Spark Architecture - Components include Driver, Executors, Cluster Manager, and Tasks

Spark/Big Datahardoptimizationpartitionspark2.5 min read

Spark Configurations for Large-Scale Jobs

Spark/Big Datahardoptimizationpartitionspark0.3 min read

Spark Execution Flow - describe

Spark/Big Datahardoptimizationpartitionspark0.4 min read

Spark Executor Management: 10 workers, 100GB RAM, 25 cores - number of executors, size, OOM in Driver

Spark/Big Datahardoptimizationpartitionspark0.4 min read

Spark Optimization - broadcast joins, caching, coalescing, predicate pushdown, AQE

Spark/Big Datahardjoinoptimizationpartition0.3 min read

Spark Optimizations: skewed joins, broadcast joins, Catalyst Optimizer, repartition vs coalesce

Spark/Big Datahardjoinoptimizationpartition0.3 min read

Spark Session Command - how to create

Spark/Big Datahardoptimizationpartitionspark0.3 min read

Spark Streaming - streaming data handling and file mounting techniques

Spark/Big Datahardoptimizationpartitionspark0.3 min read

Zen Data Shastra

Spark Submit - command syntax

Spark/Big Datahardoptimizationpartitionspark0.3 min read

Spark Tungsten & Catalyst Optimizer

Spark/Big Datahardjoinoptimizationpartition0.8 min read

Steps to link a Databricks notebook to an ADF pipeline

Spark/Big Datahardspark0.6 min read

Trade-offs between batch processing (Spark) vs. real-time streams (Kafka)

Spark/Big Datahardpartitionspark0.7 min read

Usage of UDFs?

Spark/Big Datahardoptimizationpythonsql0.6 min read

Walk through how you would debug the data ingestion process to identify slow stages.

Spark/Big Datahardpartitionspark0.6 min read

Reading isn't practice. Get AI feedback on your answers.

Type or paste your answer to any of these questions and our AI Coach scores it, highlights gaps, and rewrites it at FAANG quality. Free to try.

Try AI Answer Coach — Free Start a Mock Interview

Previous 1...11 12 13 14 15 Next

Categories

All Questions SQL Spark / Big Data Python / Coding System Design Cloud / Tools Behavioral

By Company

Amazon Google Databricks Snowflake Microsoft Netflix Uber TCS

Interview Guides

All Guides Top SQL Questions Top Spark Questions Top Python Questions Top System Design SQL Window Functions ETL Questions Data Modeling

Products

AI Interview Coach Answer Analyzer SQL Playground Resume Analyzer Interview Packs Pricing

Company

About Us Contact Us AI Disclosure Disclaimer Terms of Service Privacy Policy

© 2026 DataEngPrep.tech. All rights reserved.

About Blog Contact Disclaimer