DataFrame Module

Tabular data manipulation backed by Polars DataFrames.

The DataFrame module provides a pipe-friendly API for loading, transforming, filtering, and aggregating tabular data. DataFrames are opaque native objects that can only be manipulated through DataFrame module functions.

Common patterns

import DataFrame
import DataFrame.Expr exposing col, lit
import DataFrame.Expr as Expr

let data = DataFrame.readCsv "employees.csv"
let summary = data
    |> DataFrame.select ["name", "department", "salary"]
    |> DataFrame.filter (@salary |> Expr.gt (lit 50000))
    |> DataFrame.sort "salary"
    |> DataFrame.head 20
IO.println (DataFrame.shape summary)

Display

DataFrames render as formatted, column-aligned tables when printed or displayed in the REPL. Output includes shape, column names, dtypes, and data rows. Large DataFrames (>10 rows) show the first 5 and last 5 rows with a … separator:

shape: (1000, 3)
  name | age |     city
   str | i64 |      str
-------+-----+---------
 Alice |  30 | New York
   Bob |  25 |   London
     … |   … |        …
  Yara |  31 |   Berlin
  Zach |  22 |    Tokyo

Security

Variable	Effect
`KEEL_DATAFRAME_DISABLED=1`	Disable DataFrame operations
`KEEL_DATAFRAME_SANDBOX=/path`	Restrict file I/O to directory
`KEEL_DATAFRAME_MAX_ROWS=10000`	Limit rows loaded from files

Functions

I/O

`DataFrame.readCsv`

String -> Result DataFrame DataFrameError

Read a CSV file into a DataFrame. Accepts both local file paths and remote URLs (http://, https://).

Example:

import DataFrame

// Local file
DataFrame.readCsv "data.csv"

// Remote file
DataFrame.readCsv "https://example.com/data.csv"

DataFrame Module

Common patterns

Display

Security

Functions

I/O

DataFrame.readCsv

DataFrame.readCsvColumns

DataFrame.readJson

DataFrame.readJsonColumns

DataFrame.readJsonl

DataFrame.readJsonlColumns

DataFrame.readParquet

DataFrame.readParquetColumns

DataFrame.readDta

DataFrame.readDtaColumns

DataFrame.writeCsv

DataFrame.writeJson

DataFrame.writeParquet

DataFrame.writeDta

Column Ops

DataFrame.select

DataFrame.remove

DataFrame.rename

DataFrame.applyExprs

DataFrame.column

DataFrame.columns

DataFrame.dtypes

DataFrame.checkSchema

Row Ops

DataFrame.head

DataFrame.tail

DataFrame.slice

DataFrame.sort

DataFrame.sortDesc

DataFrame.unique

DataFrame.sample

Filters

DataFrame.filter

Aggregation

DataFrame.groupBy

DataFrame.agg

DataFrame.count

DataFrame.summary

Statistics

DataFrame.mean

DataFrame.median

DataFrame.std

DataFrame.var

DataFrame.mode

DataFrame.quantile

DataFrame.corr

DataFrame.cov

Window

DataFrame.partitionBy

DataFrame.orderBy

DataFrame.collect

DataFrame.withRowNumber

DataFrame.withRank

DataFrame.withDenseRank

DataFrame.withLag

DataFrame.withLead

DataFrame.withRollingSum

DataFrame.withRollingMean

DataFrame.withRollingMin

DataFrame.withRollingMax

DataFrame.withCumSum

DataFrame.withCumMean

DataFrame.withCumMin

DataFrame.withCumMax

Lazy

DataFrame.lazy

DataFrame.lazyCollect

DataFrame.lazyFilter

DataFrame.lazySelect

DataFrame.lazyApplyExprs

Multi-DataFrame

DataFrame.join

DataFrame.concat

DataFrame.pivot

`DataFrame.readCsv`

`DataFrame.readCsvColumns`

`DataFrame.readJson`

`DataFrame.readJsonColumns`

`DataFrame.readJsonl`

`DataFrame.readJsonlColumns`

`DataFrame.readParquet`

`DataFrame.readParquetColumns`

`DataFrame.readDta`

`DataFrame.readDtaColumns`

`DataFrame.writeCsv`

`DataFrame.writeJson`

`DataFrame.writeParquet`

`DataFrame.writeDta`

`DataFrame.select`

`DataFrame.remove`

`DataFrame.rename`

`DataFrame.applyExprs`

`DataFrame.column`

`DataFrame.columns`

`DataFrame.dtypes`

`DataFrame.checkSchema`

`DataFrame.head`

`DataFrame.tail`

`DataFrame.slice`

`DataFrame.sort`

`DataFrame.sortDesc`

`DataFrame.unique`

`DataFrame.sample`

`DataFrame.filter`

`DataFrame.groupBy`

`DataFrame.agg`

`DataFrame.count`

`DataFrame.summary`

`DataFrame.mean`

`DataFrame.median`

`DataFrame.std`

`DataFrame.var`

`DataFrame.mode`

`DataFrame.quantile`

`DataFrame.corr`

`DataFrame.cov`

`DataFrame.partitionBy`

`DataFrame.orderBy`

`DataFrame.collect`

`DataFrame.withRowNumber`

`DataFrame.withRank`

`DataFrame.withDenseRank`

`DataFrame.withLag`

`DataFrame.withLead`

`DataFrame.withRollingSum`

`DataFrame.withRollingMean`

`DataFrame.withRollingMin`

`DataFrame.withRollingMax`

`DataFrame.withCumSum`

`DataFrame.withCumMean`

`DataFrame.withCumMin`

`DataFrame.withCumMax`

`DataFrame.lazy`

`DataFrame.lazyCollect`

`DataFrame.lazyFilter`

`DataFrame.lazySelect`

`DataFrame.lazyApplyExprs`

`DataFrame.join`

`DataFrame.concat`

`DataFrame.pivot`

`DataFrame.toRecords`

`DataFrame.fromRecords`

`DataFrame.fromLists`

`DataFrame.recode`

`DataFrame.shape`

`DataFrame.setMeta`

`DataFrame.meta`

`DataFrame.allMeta`

`DataFrame.setColumnMeta`

`DataFrame.columnMeta`

`DataFrame.allColumnMeta`

`DataFrame.describeMeta`

`DataFrame.describe`

`DataFrame.search`