Complex Joins and Set Operations

Focuses on mastering joins and set operations for combining and transforming relational data across multiple tables. Candidates should understand all join types including inner, left, right, full outer, cross joins, self joins, and nested joins, and know when to use each for correctness and performance. This topic also covers set operations such as UNION, INTERSECT, and EXCEPT, differences between joins and set operations, handling duplicates and NULL values correctly, choosing between joins, subqueries, and common table expressions for clarity and efficiency, and reasoning about join order and its performance implications on large tables. Interview questions may include multi table join problems, complex business logic across four or more tables, and scenarios that reveal trade offs between approaches.

0 questions

Indexing Strategy and Selection

Covers index design principles and practical selection of indexes to accelerate queries while managing storage and write cost. Topics include index types such as B tree hash and bitmap indexes and full text and functional indexes; single column composite and covering indexes; clustered versus nonclustered index architectures and partial or filtered indexes. Candidates should reason about index selectivity and cardinality and how statistics and histograms influence optimizer choices. Also assess index maintenance overhead fragmentation and rebuild strategies and the trade off between faster reads and slower inserts updates and deletes. Practical skills include reading execution plans to identify missing or inefficient indexes proposing index consolidation or covering index designs testing and benchmarking index changes and understanding interactions between indexing partitioning and denormalization.

0 questions

Database Design and Architecture

Designing and architecting databases for production and cloud environments with attention to data modeling, schema design, and access pattern optimization. Topics include normalization and denormalization trade offs, schema versus query driven modeling, entity and relationship design for transactional and analytical workloads, indexing and query optimization techniques, partitioning and sharding design decisions, schema evolution and migration strategies, materialized views and caching strategies, selection of storage layers for different data shapes, and practical operational runbooks for provisioning, monitoring, alerting, backups, disaster recovery, and capacity planning. Candidates should justify schema and architecture choices with respect to latency, throughput, development and operational complexity, maintainability, and cost.

0 questions

Structured Query Language Join Operations

Comprehensive coverage of Structured Query Language join types and multi table query patterns used to combine relational data and answer business questions. Topics include inner join, left join, right join, full outer join, cross join, self join, and anti join patterns implemented with NOT EXISTS and NOT IN. Candidates should understand equi joins versus non equi joins, joining on expressions and composite keys, and how join choice affects row counts and null semantics. Practical skills include translating business requirements into correct join logic, chaining joins across two or more tables, constructing multi table aggregations, handling one to many relationships and duplicate rows, deduplication strategies, and managing orphan records and referential integrity issues. Additional areas covered are join conditions versus WHERE clause filtering, aliasing for readability, using functions such as coalesce to manage null values, avoiding unintended Cartesian products, and basic performance considerations including join order, appropriate indexing, and interpreting query execution plans to diagnose slow joins. Interviewers may probe result correctness, edge cases such as null and composite key behavior, and the candidate ability to validate outputs against expected business logic.

0 questions

SQL Fundamentals and Query Writing

Comprehensive query writing skills from basic to intermediate level. Topics include SELECT and WHERE, joining tables with inner and outer joins, grouping with GROUP BY and filtering groups with HAVING, common aggregation functions such as COUNT SUM AVG MIN and MAX, ORDER BY and DISTINCT, subqueries and common table expressions, basic window functions such as ROW_NUMBER and RANK, union operations, and principles of readable and maintainable query composition. Also covers basic query execution awareness and common performance pitfalls and how to write correct, efficient queries for combining and summarizing relational data.

0 questions

SQL Scenarios

Advanced SQL query design and optimization scenarios, including complex joins, subqueries, window functions, common table expressions (CTEs), set operations, indexing strategies, explain plans, and performance considerations across relational databases.

0 questions

Set Operations and Complex Aggregations

Understanding UNION, UNION ALL, EXCEPT, INTERSECT operations and their performance implications. Complex GROUP BY queries, HAVING clauses, and multi-level aggregations.

0 questions

Data Modeling for DoorDash Domain

Data modeling concepts tailored to the DoorDash domain, including conceptual and logical modeling, entity-relationship and dimensional modeling, schema design for transactional OLTP systems and analytical workloads, domain-driven design considerations for orders, restaurants, menus, drivers, deliveries, payments, and logs, data access patterns, and governance and schema evolution for a high-traffic on-demand delivery platform.

0 questions

Relational Database Fundamentals and Design

Core concepts of relational databases and schema design including tables, relationships such as one to one one to many and many to many, primary keys and foreign keys, data integrity constraints, and the properties of atomicity consistency isolation and durability and why they matter. Understand differences between relational systems using structured query language and nonrelational databases, indexing strategies, normalization and denormalization trade offs, simple query optimization techniques, and when to choose a normalized relational design versus a document or key value store. Candidates should be able to perform basic entity identification, produce simple schema diagrams, explain persistence and durability considerations, and reason about basic performance and scaling trade offs.

0 questions

Consistency Models and Transactions

Comprehensive knowledge of data consistency models and transactional guarantees in databases and distributed systems. This includes understanding transaction properties such as Atomicity, Consistency, Isolation, and Durability (ACID) and alternative design philosophies such as Basically Available, Soft state, Eventually consistent (BASE). Candidates should be able to choose appropriate isolation levels including read uncommitted, read committed, repeatable read, serializable, and snapshot isolation and explain performance versus correctness tradeoffs and common anomalies such as dirty reads, non repeatable reads, phantom reads, lost updates, and write skew. Understand consistency models including strong consistency, strict serializability, serializability, snapshot isolation, causal consistency, eventual consistency, monotonic reads, and read your writes, and when each model is acceptable based on latency, availability, and business correctness requirements. Discuss replication strategies and their impact on guarantees, including synchronous versus asynchronous replication, multi region replication, replication lag, and replica divergence. Evaluate distributed transaction and coordination approaches such as two phase commit and consensus based protocols and weigh their performance and failure modes. Propose conflict detection and resolution strategies such as last write wins, version vectors and vector clocks, conflict free replicated data types, application level reconciliation, idempotent operations, retries, and saga or compensation patterns for long running workflows. Consider practical engineering concerns including consistency service level objectives, monitoring and alerting for staleness and replication lag, testing strategies for consistency, implications for caching and sharding, and the tradeoffs between developer complexity and user facing correctness.

0 questions

Storage and Database Infrastructure

Storage concepts: SSDs vs. HDDs, RAID configurations, storage protocols. Database troubleshooting basics, replication concepts, backup and recovery strategies, understanding query performance and index behavior, and storage at scale.

0 questions

Database Fundamentals and Data Modeling

Encompasses foundational database concepts and techniques for designing and querying data stores. Topics include relational database concepts, structured query language fundamentals for selecting and modifying data, schema design with tables and relationships, normalization principles, entity relationship modeling, indexing and basic performance considerations, transactions and data integrity, constraints and data types, and common operational tasks such as migrations, backups, and simple optimization strategies. Also discusses trade offs with nonrelational stores and when to choose different persistence models.

0 questions

Data Aggregation and Filtering

Focuses on using query operations to filter and aggregate datasets efficiently and correctly. Candidates should demonstrate filtering rows by conditions, applying time based filters, grouping by one or more dimensions, and using aggregate functions such as count, sum, average, minimum, and maximum. It includes correct use of pre aggregation filters and post aggregation filters, the difference between filtering rows before aggregation and filtering aggregated results, combining multiple aggregation levels, calculating distinct counts and percentiles, and composing queries that combine conditional logic and aggregation in a single statement. Performance and readability of queries, and choosing appropriate aggregation granularity for business questions, are also relevant.

0 questions

Data Infrastructure Technology Selection

Deep understanding of specific technologies relevant to complex system design. Master databases (PostgreSQL, Cassandra, DynamoDB, Elasticsearch), message queues (Kafka, RabbitMQ), caching systems (Redis), search engines, and frameworks. Understand their strengths, weaknesses, trade-offs, operational characteristics, scaling patterns, and common pitfalls. Be able to justify technology choices based on specific system requirements.

0 questions

Database Internals and Architecture

Focuses on how database engines work internally and how internal architecture affects performance, correctness, and scalability. Key concepts include index data structures and properties such as B trees, transaction mechanisms and isolation levels and their effects on phenomena like dirty reads and phantom reads, multi version concurrency control, write ahead logging and recovery, locking strategies and concurrency control, storage layouts including row oriented and column oriented formats, partitioning and sharding strategies, query execution engines and optimization techniques, and design trade offs between different database technologies. Candidates should be able to read and reason about explain plans and map internals to observable performance characteristics and failure modes.

0 questions

Database Troubleshooting and Diagnostics

Systematic approaches and technical techniques for diagnosing database issues and restoring healthy operation. Topics include identifying symptoms, gathering diagnostic data from error logs and system views, analyzing slow queries with explain plans and profiling, diagnosing connection and authentication failures, detecting and resolving deadlocks and blocking, capacity and storage issues, replication and consistency problems, backup and restore verification, and corruption investigation. Candidates should be familiar with database specific diagnostic tools, monitoring and alerting metrics, indexing and query optimization strategies, and effective communication of findings to application and infrastructure teams.

0 questions

Join Operations and Multi Table Queries

Comprehensive mastery of joining data across two or more tables in Structured Query Language. Candidates should understand and be able to use inner join, left join, right join, and full outer join semantics, including how each type affects row inclusion and null propagation. Be familiar with self joins, cross joins and anti join and semi join patterns for filtering. Know how to write correct multi table join conditions to avoid inadvertent Cartesian products, how to deduplicate and validate results by checking row counts and key uniqueness, and how to handle nulls and duplicate column names. Understand when to prefer joins versus subqueries or common table expressions for clarity or performance. Be able to read and interpret execution plans and explain how join order, join algorithms such as nested loop join, hash join, and merge join, and appropriate indexing affect performance. Recognize differences in join syntax and behavior across Structured Query Language dialects, including use of USING versus ON clauses and older comma separated join styles. Practice building queries that combine filtering, aggregation, grouping, and joins across three or more tables to express realistic business logic while keeping correctness and performance in mind.

0 questions

Search and Indexing at Scale

Designing search systems using technologies like Elasticsearch or similar. Understanding indexing strategies, query optimization, and ranking algorithms. Designing relevance scoring and filtering mechanisms.

0 questions

Database Fundamentals and SQL Literacy

Core relational database concepts and basic SQL literacy. Covers database objects such as tables, rows, and columns, primary keys and foreign keys, relationships and referential integrity, simple schema design concepts and normalization, indexing basics and their effect on performance, transactions and basic consistency concepts, and reading and interpreting simple SQL queries including SELECT JOIN GROUP BY and COUNT. This topic assesses whether a candidate understands how data is stored and related and can translate simple business questions to database queries.

0 questions

SQL Server

SQL Server relational database management system (RDBMS); covers installation and configuration, T-SQL programming, indexing and query optimization, data modeling, data types, transaction handling, backup and recovery, replication, high availability (Always On), security, maintenance, and administration tasks specific to SQL Server.

0 questions

Data Model Design and Access Patterns

Discuss how you'd design data models based on access patterns. Understand relational vs. NoSQL trade-offs. Know when to denormalize, how to handle distributed transactions, and strategies for scaling databases (sharding, partitioning). Discuss read vs. write optimization.

0 questions

Database Scalability and Performance Principles

Understanding of vertical vs. horizontal scaling, partitioning strategies, sharding concepts, read replicas, and the trade-offs between consistency, availability, and partition tolerance.

0 questions

Relational Databases and SQL

Focuses on relational database fundamentals and practical SQL skills. Candidates should be able to write and reason about SELECT queries, JOINs, aggregations, grouping, filtering, common table expressions, and window functions. They should understand schema design trade offs including normalization and denormalization, indexing strategies and index types, query performance considerations and basic optimization techniques, how to read an execution plan, and transaction semantics including isolation levels and ACID guarantees. Interviewers may test writing efficient queries, designing normalized schemas for given requirements, suggesting appropriate indexes, and explaining how to diagnose and improve slow queries.

0 questions

Relational Schema Design and Normalization

Designing schemas for relational databases and applying normalization principles to reduce redundancy and maintain data integrity. Candidates should understand the normal forms including first normal form, second normal form, third normal form, and Boyce Codd normal form; primary keys, foreign keys, referential integrity, and how to model relationships such as one to one, one to many, and many to many using junction tables. Coverage includes entity relationship modeling, data modeling techniques, handling hierarchical or recursive data, choosing appropriate data types, and recognizing normalization violations in poorly designed schemas. Also discuss practical denormalization trade offs for performance, when and how to intentionally denormalize, designing schemas for maintainability and common query patterns, and considerations for analytics schemas such as star schemas and slowly changing dimensions.

0 questions

Working with Sample Datasets and Schemas

Get comfortable quickly understanding an unfamiliar database schema before you ever write a query. Practice identifying primary and foreign keys, tracing relationships between tables (one-to-many, many-to-many, self-referencing), and distinguishing natural keys from surrogate keys. Learn a methodical exploration approach: skim table and column names, check information_schema or an ER diagram if one exists, follow foreign key chains outward from a core entity, and note nullable columns and naming conventions that hint at business rules. This skill transfers across domains, whether the schema is e-commerce (orders, customers, products), SaaS (accounts, users, subscriptions), or a revenue/CRM tech stack (leads, accounts, opportunities, interactions).

0 questions

Save and Persistence System Design

Design considerations for robust save and load systems, commonly used in gaming and complex stateful applications. Topics include serialization formats and versioning, backward and forward compatibility, storage strategies including cloud saves and cross platform sync, validation and corruption handling, memory and performance trade offs, and approaches for large and nested state, checkpoints, and rollback.

0 questions

Database and Caching Strategies

Understanding when and how to use persistent databases and in memory caching to improve application performance and scalability. Candidates should be able to explain read and write optimization patterns, basic indexing concepts, trade offs between consistency and availability, replication and sharding approaches, cache types and placement, cache invalidation strategies and time to live policies, and when an in memory cache such as Redis or Memcached is appropriate. Discussion should include common bottlenecks, monitoring and operational considerations, and how caching interacts with application correctness and latency.

0 questions

Data Organization and Tracking

Designing, structuring, and maintaining data models and lightweight tracking systems that support operational work such as records, cases, vendors, projects, budgets, and compliance obligations. Candidates should be able to define the right fields and metadata, unique identifiers, relationships between entities, lifecycle statuses, milestone and deadline tracking, recurrence or renewal triggers, and reporting requirements. Discussion should include choices between normalized and pragmatic schemas, tagging and taxonomy, searchability and indexing, dashboards and metrics for stakeholders, integration considerations with adjacent line-of-business systems, data governance, ownership and stewardship, access controls and privacy, retention and audit trail policies, and practical implementation approaches from spreadsheets to databases and commercial platforms.

0 questions

Database Architecture and Optimization

Designing and tuning data storage systems to meet requirements for availability, latency, throughput, and cost. Topics include choosing between managed relational services and NoSQL key value or document stores, data modelling and schema design, partitioning and sharding strategies, replication and read replica patterns, indexing and query optimization, transaction and consistency trade offs, connection pooling and resource management, caching and cache invalidation strategies, backup and retention policies, capacity planning and monitoring, and approaches for migrating or scaling databases in production. Candidates should be able to discuss concrete techniques for improving performance, diagnosing slow queries, and balancing operational complexity against performance and cost.

0 questions

Distributed Database Architecture

Covers principles and patterns for designing databases that span nodes and regions. Subjects include replication strategies synchronous and asynchronous, partitioning and sharding approaches, leader follower and multi leader architectures, consensus mechanisms and their trade offs, consistency models including eventual consistency and strong consistency, cross region failover and disaster recovery, indexing and query routing in partitioned systems, transactional semantics and distributed transactions, and operational concerns such as backup, schema evolution, and performance tuning for distributed data stores.

0 questions

Database Design and Query Optimization

Principles of database schema design and performance optimization including relational and non relational trade offs, normalization and denormalization, indexing strategies and index types, clustered and non clustered indexes, query execution plans, common table expressions for readable complex queries, detecting missing or redundant indexes, sharding and partitioning strategies, and consistency and availability trade offs. Candidates should demonstrate knowledge of optimizing reads and writes, diagnosing slow queries, and selecting the appropriate database model for scale and consistency requirements.

42 questions

Query Optimization and Execution Plans

Focuses on diagnosing slow queries and reducing execution cost through analysis of query execution plans and systematic query rewrites. Candidates should be able to read and interpret explain output and execution plans including identifying expensive operators such as sequential table scans index scans sorts nested loop join hash join and merge join and explaining why those operators appear. Core skills include cost and cardinality estimation understanding join order and predicate placement predicate pushdown and selectivity reasoning comparing exists versus in versus join patterns and identifying common anti patterns such as N plus one queries. The topic covers profiling and benchmarking approaches using explain analyze and runtime statistics comparing estimated and actual row counts proposing and validating query rewrites and configuration or schema changes and reasoning about trade offs when using materialized views caching denormalization or partitioning to improve performance. Candidates should present step by step approaches to diagnose problems measure improvements and assess impact on other workloads.

0 questions

Database Selection and Trade Offs

How to evaluate and choose data storage systems and architectures based on workload characteristics and business constraints. Coverage includes differences between relational and nonrelational families such as document stores, key value stores, wide column stores, graph databases, time series databases, and search engines; mapping query patterns and latency requirements to storage options; trade offs between strong consistency and eventual consistency and their impact on availability and complexity; partition key design, replication strategies, and high availability considerations; operational concerns including backups, monitoring, vendor and cost trade offs, migration or hybrid strategies, and when to adopt polyglot persistence. Senior level discussion includes selecting specific managed services and reasoning about expected load patterns, failure modes, and operational burden.

33 questions

Database and Data Platform Selection

Evaluation and selection of database and data platform technologies to meet analytical and operational needs. Covers assessment of relational, non relational, columnar, and specialized systems such as time series and search engines; data warehouse platforms and cloud analytics platforms; query patterns and workload characteristics; consistency and transactional guarantees; partitioning and clustering strategies; storage formats and compression; performance and scalability trade offs; operational complexity and administration overhead; data ingestion and incremental loading patterns; pricing and cloud platform considerations; and how to choose the right solution based on data volume, concurrency, latency requirements, and total cost of ownership.

0 questions

Advanced Querying with Structured Query Language

Covers authoring correct, maintainable, and high quality Structured Query Language statements for analytical and transactional problems. Candidates should demonstrate writing Select Insert Update and Delete statements and using filtering grouping ordering and aggregation correctly. Emphasis is on complex query constructs and patterns such as multi table joins and join condition logic self joins for hierarchical data nested and correlated subqueries common table expressions including recursive common table expressions window functions such as row number rank dense rank lag and lead set operations like union and union all and techniques for calculating running totals moving averages cohort metrics and consecutive event detection. Candidates should be able to break down and refactor complex requirements into composable queries for readability and maintainability while reasoning about performance implications on large data sets. Senior expectations may include mentoring on best practices for query composition and understanding how schema and configuration choices influence query performance.

0 questions

Complex Data Integration and Joins

Handling intricate join scenarios: multi-condition joins, conditional joins with complex logic, joining on date ranges or overlapping time periods, complex left joins with multiple filtering conditions, self-joins for hierarchical or relationship data, handling non-standard relationships between tables. Understanding implications of different join types on row counts, NULL values, and duplicate handling. Designing queries that correctly integrate data from multiple sources while maintaining data integrity and avoiding duplicate counting or missing data.

0 questions

Database Architecture and Partitioning

Design database architecture and partitioning strategies appropriate to workload and access patterns. Evaluate database types including relational and various NoSQL models, schema design and indexing strategies, and when to use a monolithic database versus sharding. Cover sharding approaches such as range based, hash based, consistent hashing, and directory based sharding, as well as replica topologies, read replicas, replication lag, and handling cross shard queries. Address operational concerns at scale: resharding, mitigating hot partitions, balancing data distribution, transactional and consistency guarantees, and the trade offs between availability, consistency, and partition tolerance. Include monitoring, migration strategies, and impact on application logic and joins.

0 questions

CTEs & Subqueries

Common Table Expressions (CTEs) and subqueries in SQL, including syntax, recursive CTEs, usage patterns, performance implications, and techniques for writing clear, efficient queries. Covers when to use CTEs versus subqueries, refactoring patterns, and potential pitfalls.

0 questions

Aggregation and Grouping

Covers SQL grouping and aggregation concepts used to summarize data across rows. Key skills include using GROUP BY with aggregate functions such as COUNT, SUM, AVG, MIN, and MAX, counting distinct values, and filtering grouped results with HAVING while understanding the difference between WHERE and HAVING. Candidates should demonstrate correct handling of NULL values in aggregates, grouping by expressions and multiple columns, and writing multi level aggregations using ROLLUP, CUBE, and GROUPING SETS. Also important is knowing when to use subqueries or common table expressions for intermediate aggregation, the difference between aggregate functions and window functions, and how grouping interacts with joins and data types. Interview questions may test correctness of queries, edge cases, performance considerations such as appropriate indexes and query plans, and the ability to transform business questions like who are the top customers or which categories have declining sales into correct aggregated SQL statements.

0 questions

Common Table Expressions and Subqueries

Covers writing and structuring complex SQL queries using Common Table Expressions and subqueries, including when to prefer one approach over another for readability, maintainability, and performance. Candidates should be able to author WITH clauses to break multi step logic into clear stages, implement recursive CTEs for hierarchical data, and use subqueries in SELECT, FROM, and WHERE clauses. This topic also includes understanding correlated versus non correlated subqueries, how subqueries interact with joins and window functions, and practical guidance on choosing CTEs, subqueries, or joins based on clarity and execution characteristics. Interviewers may probe syntax, typical pitfalls, refactoring nested queries into CTEs, testing and validating each step of a CTE pipeline, and trade offs that affect execution plans and index usage.

0 questions

Data Modeling and Schema Design

Focuses on designing efficient, maintainable data schemas for transactional and analytical systems. Candidates should demonstrate understanding of normalization principles and normal forms, when and why to denormalize for performance, and schema design patterns for different use cases. Expect dimensional modeling topics including fact and dimension tables, star and snowflake schemas, grain definition, slowly changing dimensions, and strategies for handling historical data. The topic also includes trade offs between online transaction processing and online analytical processing designs, query performance considerations, indexing and partitioning strategies, and the ability to evaluate and improve existing schemas to meet business requirements and scale.

35 questions

Advanced SQL Window Functions

Mastery of Structured Query Language window functions and advanced aggregation techniques for analytical queries. Core function families include ranking functions such as ROW_NUMBER, RANK, DENSE_RANK, and NTILE; offset functions such as LAG and LEAD; value functions such as FIRST_VALUE, LAST_VALUE, and NTH_VALUE; and aggregate window expressions such as SUM OVER and AVG OVER. Candidates should understand the OVER clause with PARTITION BY and ORDER BY, frame specifications using ROWS BETWEEN and RANGE BETWEEN, tie handling, null behavior, and how frame definitions affect results. Common application patterns include top N per group, deduplication using row numbering, running totals and cumulative aggregates, moving averages, percent rank and distribution calculations, event sequencing and period over period comparisons, gap and island analysis, cohort and retention analysis, and trend and growth calculations. The topic also covers structuring complex queries with Common Table Expressions including recursive Common Table Expressions to break multi step analytical pipelines and to handle hierarchical or iterative problems, and choosing between window functions, GROUP BY, joins, and subqueries for correctness and readability. Performance and correctness considerations are essential, including join and sort costs, index usage, memory and sort spill behavior, execution planning and query optimization techniques, and trade offs across different database dialects and large data volumes. Interview assessments typically ask candidates to write and explain queries that use these functions, reason about frame semantics for edge cases such as ties, nulls, and partition boundaries, and to rewrite or optimize expensive queries.

0 questions

Database Scalability and High Availability

Architectural approaches and operational practices for scaling and maintaining database availability. Topics include vertical versus horizontal scaling trade offs; replication topologies, leader and follower roles, read replicas and replica lag; read write splitting and connection pooling; sharding and partitioning strategies including range based, hash based, and consistent hashing approaches; handling hot partitions and data skew; federation and multi database federation patterns; cache layers and cache invalidation; rebalancing and resharding strategies; distributed concurrency control and transactional guarantees across shards; multi region deployment strategies, cross region failover and disaster recovery; monitoring, capacity planning, automation for failover and backups, and cost optimization at scale. Candidates should be able to pick scaling approaches based on read and write patterns and explain operational complexity and trade offs introduced by distributed data.

0 questions

Data Partitioning and Sharding

Techniques and operational practices for horizontally partitioning data across multiple database instances or storage nodes to achieve scale, improve performance, and manage growth. Includes selection and design of partition and shard keys to evenly distribute load and avoid hotspots, with range based, hash based, and directory based approaches and consistent hashing mechanisms. Covers handling uneven distribution and data skew, hotspot detection and mitigation, and the impact of partitioning on query patterns such as joins and cross shard queries. Explains implications for transactions and consistency, including transactional boundaries that span partitions and approaches to distributed transactions and compensation. Describes resharding and online data migration strategies, rolling rebalances, and methods to minimize downtime and data movement. Emphasizes operational concerns including shard management, automation, monitoring and alerting, failure recovery, and performance tuning. Discusses trade offs between simplicity, latency, throughput, and operational complexity and highlights considerations for both transactional and analytical workloads, including routing, caching, and coordination patterns.

0 questions

Advanced SQL: Window Functions & CTEs for Complex Analysis

Advanced SQL techniques using window functions (ROW_NUMBER, RANK, DENSE_RANK, etc.) and common table expressions (CTEs), including recursive queries, for complex data analysis, ranking and analytics patterns, cumulative totals, and multi-step data transformations within relational databases and data warehousing contexts.

10 questions

Database Replication and High Availability

Comprehensive coverage of database replication architectures, topologies, design tradeoffs, and operational practices used to achieve high availability and data durability. Candidates should understand replication models such as primary backup, master slave, multi master, cascading replication, and read replica topologies, and explain synchronous versus asynchronous modes and the tradeoffs between consistency, latency, throughput, and durability. Important areas include causes of replication lag and mitigation techniques such as parallel apply, batching, compression, flow control, and topology choices that reduce lag; conflict detection and resolution in multi master setups including version vectors, vector clocks, causal ordering, last writer wins, and application level reconciliation; and split brain scenarios with prevention techniques such as quorum voting, fencing, and membership management. The topic also encompasses automatic failover and leader election using consensus protocols, implications for recovery point objective and recovery time objective depending on replication choices, backup and restore interactions and snapshot consistency, read scaling versus write scaling limits, redundancy and clustering strategies, quorum and availability group design, capacity planning, network and storage considerations, monitoring and alerting metrics for replication health and lag, testing and rehearsing failover, automation of failover and promotion, and concrete examples and tools such as MySQL replication, PostgreSQL streaming replication, Galera cluster, distributed consensus implementations like Paxos and Raft, and cloud managed availability services.

0 questions

Transaction Management and Concurrency Control

Covers transaction management and concurrency control in database and storage systems, focusing on the four foundational properties of transactions: atomicity, consistency, isolation, and durability. Candidates should understand the transaction lifecycle including begin, commit, and rollback semantics; how atomicity and durability are implemented through write ahead logging, checkpoints, and recovery; and how consistency is enforced via integrity constraints and application invariants. Describe isolation levels such as Read Uncommitted, Read Committed, Repeatable Read, and Serializable, and explain the concrete anomalies each level permits or prevents, including dirty reads, non repeatable reads, lost updates, and phantom reads, as well as the concept of serializability as a correctness criterion. Cover concurrency control mechanisms including locking protocols with modes and granularity at row, page, and table levels, lock escalation, two phase locking, deadlock detection and resolution strategies, optimistic versus pessimistic concurrency strategies, and multi version concurrency control and snapshot isolation. Discuss performance and scalability trade offs when selecting isolation levels or concurrency strategies, practical diagnostics and monitoring for lock contention and deadlocks, and distributed transaction considerations such as two phase commit coordination, global ordering and partial failures, eventual consistency models, and when it is acceptable to relax strict transactional guarantees for availability or latency in distributed systems.

0 questions

Database Performance Tuning and Scaling

Addresses database system level performance and scaling strategies and how they interact with query design. Candidates should describe approaches for identifying and resolving database level bottlenecks including slow query diagnosis using logs and profiling instrumenting metrics and establishing baselines and targets for latency and throughput. Topics include caching strategies materialized views partitioning and sharding replication and read replica architectures connection management and improving cache utilization as well as trade offs when denormalizing schema or adopting alternative data models. Candidates should be able to propose step by step remediation plans measure the impact of changes and reason about operational concerns such as index maintenance windows monitoring and capacity planning.

0 questions

Database Fundamentals and Storage Engines

Core principles and components of data storage and persistence systems. This includes storage engine architectures and how they affect query processing and performance; transactions and isolation including atomicity, consistency, isolation, and durability; concurrency control and isolation levels; indexing strategies and how indexes affect read and write amplification; physical versus logical storage and object, block, and file storage characteristics; caching layers and cache invalidation patterns; replication basics and how replication affects durability and read performance; backup and recovery techniques including snapshots and point in time recovery; trade offs captured by consistency, availability, and partition tolerance reasoning; compression, cost versus performance trade offs, data retention, archival, and compliance concerns. Candidates should be able to reason about durability, persistence guarantees, operational recovery, and storage choices that affect latency, throughput, and cost.

0 questions

Database Engineering & Data Systems Topics

Complex Joins and Set Operations

Indexing Strategy and Selection

Database Design and Architecture

Structured Query Language Join Operations

SQL Fundamentals and Query Writing

SQL Scenarios

Set Operations and Complex Aggregations

Data Modeling for DoorDash Domain

Relational Database Fundamentals and Design

Consistency Models and Transactions

Storage and Database Infrastructure

Database Fundamentals and Data Modeling

Data Aggregation and Filtering

Data Infrastructure Technology Selection

Database Internals and Architecture

Database Troubleshooting and Diagnostics

Join Operations and Multi Table Queries

Search and Indexing at Scale

Database Fundamentals and SQL Literacy

SQL Server

Data Model Design and Access Patterns

Database Scalability and Performance Principles

Relational Databases and SQL

Relational Schema Design and Normalization

Working with Sample Datasets and Schemas

Save and Persistence System Design

Database and Caching Strategies

Data Organization and Tracking

Database Architecture and Optimization

Distributed Database Architecture

Database Design and Query Optimization

Query Optimization and Execution Plans

Database Selection and Trade Offs

Database and Data Platform Selection

Advanced Querying with Structured Query Language

Complex Data Integration and Joins

Database Architecture and Partitioning

CTEs & Subqueries

Aggregation and Grouping

Common Table Expressions and Subqueries

Data Modeling and Schema Design

Advanced SQL Window Functions

Database Scalability and High Availability

Data Partitioning and Sharding

Advanced SQL: Window Functions & CTEs for Complex Analysis

Database Replication and High Availability

Transaction Management and Concurrency Control

Database Performance Tuning and Scaling

Database Fundamentals and Storage Engines