数据清理
解析 Trino / Hive 控制台输出,或 CSV / TSV 文本,自动检测异常并导出尚无数据
点击右上角"输入文本"或"上传文件"开始
支持最多 {{ fmtNum(config.max_total_rows) }} 行 · 单文件最大 {{ config.max_upload_mb }} MB
缺失值 {{ fmtNum(summary.missing_count) }}
乱码 {{ fmtNum(summary.garbled_count) }}
类型错误 {{ fmtNum(summary.type_error_count) }}
重复行 {{ fmtNum(summary.duplicate_count) }}
格式:{{ formatDetected }}
总行数 {{ fmtNum(summary.total_rows) }}
列数 {{ fmtNum(summary.total_columns) }}
异常 {{ fmtNum(summary.total_anomalies) }}
无异常
| # | {{ c }} |
|---|
历史记录
浏览器本地缓存的最近解析会话(数据不上传服务端持久化)暂无历史
每次解析成功后会在此处留下记录
| 时间 | 格式 | 行数 | 列数 | 异常 | 会话 ID |
|---|---|---|---|---|---|
| {{ h.time }} | {{ h.format }} | {{ fmtNum(h.rows) }} | {{ fmtNum(h.cols) }} | {{ fmtNum(h.anomalies) }} | {{ h.session_id.slice(0, 8) }} |
邮件设置
这里设置的 SMTP 信息仅保存在浏览器本地(localStorage),用于"发送邮件"对话框的默认值
若服务端已经配置了环境变量
SMTP_HOST/SMTP_USER/SMTP_PASSWORD,
则无需在此填写,发送邮件时直接调用即可。
帮助 / 关于
支持的输入
- Trino 控制台输出(含 ASCII 框线、
(N rows)尾行) - Hive 控制台输出(
+----+----+框线) - CSV / TSV(首行可为表头,自动识别分隔符)
检测的异常类型
- 缺失值:空字符串 / NULL / NaN / N/A
- 乱码:替换字符
U+FFFD或非常规控制符 - 类型错误:列被推断为数值/日期但单元格不符
- 重复行:完整内容与其他行一致
数据安全
数据仅在服务端内存中保留 1 小时,不会落盘。SMTP 凭证不会写入日志。
对外部署时请通过环境变量 APP_TOKEN 启用访问令牌。
限制
- 单次解析最多 {{ fmtNum(config.max_total_rows) }} 行
- 单文件上传最大 {{ config.max_upload_mb }} MB
- 表格预览最多 {{ fmtNum(config.max_preview_rows) }} 行(导出不受此限制)