Data Science in Production: Building Scalable Model Pipelines/

...

/

- Best Practices

- Best Practices

Best practices for Python programmers using PySpark.

We'll cover the following...

Avoid dictionaries
Limit Pandas usage
Avoid loops
Minimize eager operations
Use SQL