This commit is contained in:
2026-01-22 22:42:07 +08:00
commit f31340ab93
3 changed files with 288 additions and 0 deletions

176
docs/issues.md Normal file
View File

@@ -0,0 +1,176 @@
## 你目前设计里最容易被忽略的点(高优先级)
### 1) 微服务拆分的时序与边界
* 你写了“微服务 + K8s”但阶段 1 又是 MVP。需要你明确**MVP 阶段是否仍按单体/模块化实现**,还是从一开始就拆服务?否则会出现“为了拆而拆”导致交付极慢。
* “个人任务服务”和“团队任务服务”边界:**同一份任务模型是否复用?**(字段/状态/权限/共享逻辑是否一致)如果不清晰,后期会出现大量重复代码与不一致行为。
### 2) 权限模型过于粗
* 你只写了“普通用户/管理员”。但你又支持团队/组织、多租户、协作编辑:这里通常需要更细的授权维度(例如:团队角色 vs 资源级权限)。
* 需要你明确:**权限是 RBAC 还是 ABAC**以及“任务”这一资源的授权粒度:按列表/项目/任务?是否支持只读、可评论、可编辑、可管理?
### 3) JWT + Refresh Token 的安全细节没落地
你写了机制,但没写关键决策点:
* Refresh Token 存哪httpOnly cookie / localStorage / DB**多端登录**如何管理(每设备一份还是共享一份)?
* Token 轮换/吊销:**如何“立即登出”**、如何处理泄露、是否做 refresh token rotation + reuse detection
* CSRF/CORS 策略:如果用 cookie需要明确 CSRF 方案;如果用 header token需要明确 XSS 风险与防护。
### 4) “实时同步 + 离线 + 冲突处理”缺少一致性边界
你提到版本号控制,但缺少决策点:
* 冲突的“真相源”是谁:服务端强一致、还是客户端合并、还是最后写入 wins
* 版本号是**行级/任务级/字段级**?拖拽排序会带来大量并发写,冲突策略要提前定。
* 离线恢复:需要明确**操作日志oplog**还是全量覆盖?恢复时如何幂等?如何处理重放导致的重复创建/重复通知?
### 5) “排序/拖拽”在 DB 层的表示
* 任务排序字段用什么策略(浮点/稠密 rank/链表/分段),批量移动时复杂度如何控制。
* 团队协作下两个人同时拖拽同一列表,冲突规则是什么。
---
## 架构与工程层面的漏项(中高优先级)
### 6) 数据域与事件流缺口
你有 Kafka但没有写
* 哪些场景发事件(任务创建/状态变化/到期/成员变更),哪些服务订阅(通知/搜索索引/统计)。
* 事件的**幂等键、重试、死信队列**、顺序性要求(同一任务的事件是否要求有序)。
### 7) 数据库与多租户隔离策略没定
你写“多租户可选”,但需要明确:
* 隔离方式:同库同表加 tenant_id / schema-per-tenant / db-per-tenant。
* 索引策略tenant_id + 常用过滤字段的联合索引,否则一上量就慢。
* 数据导出/删除GDPR 类需求):租户级删除如何落地。
### 8) 搜索Elastic与一致性/权限过滤
* 索引更新是同步还是异步?异步就会有“刚改完搜不到/刚删还搜得到”的窗口,你要接受还是要补偿。
* 更关键:**搜索结果如何做权限过滤**(尤其团队任务)——是索引里预计算 ACL还是查询后回源 DB 过滤?两种成本差异很大。
### 9) 统计分析服务的数据来源
* 统计是直接扫业务库、还是走事件/数仓OLAP如果直接扫 PostgreSQL后期会影响主库。
* 指标口径要提前定:完成度如何算?归档算不算?重复任务怎么算?
### 10) 附件功能缺少存储与安全链路
你写“附件”,但没写:
* 对象存储S3/MinIO/OSS与上传方式直传/中转)、预签名 URL。
* 权限校验:下载链接如何防泄露;是否要病毒扫描/类型限制/大小限制。
---
## API 与可观测性漏项(中优先级)
### 11) REST 统一,但跨服务调用与版本管理没写
* 内部服务间也用 REST需要明确超时、重试、熔断、限流、降级策略否则生产级链路会很脆
* API 版本策略:/v1、header 版本、还是字段向后兼容OpenAPI 如何跟版本绑定?
### 12) 幂等性与一致性保障
* 任务创建/批量操作/通知触发都需要幂等策略:请求重试、网络抖动会重复写。
* 事务边界:跨服务操作(例如创建任务后发通知 + 建索引)如何保证“至少一次/恰好一次”的效果?你目前没定义接受的语义。
### 13) 观测只列了工具,缺少“约定”
* traceId 如何贯穿网关→各服务→Kafka
* 日志规范:结构化字段、用户标识脱敏、错误分级。
* SLO/报警你要监控哪些关键指标登录失败率、任务写入错误率、WebSocket 连接数、消费堆积等)。
---
## 测试与交付漏项(中优先级)
### 14) 测试分层覆盖点没写
* 微服务下建议考虑**契约测试**consumer-driven contract否则服务改动容易把别的服务打崩。
* 离线/冲突/实时同步属于“最难测”的部分:需要明确用什么方式做端到端场景测试与回归数据集。
### 15) 数据迁移与灰度发布
* PostgreSQL schema 迁移工具与流程(向前兼容/回滚策略)。
* 灰度发布时旧客户端/新服务并存的兼容策略(尤其 Token、WebSocket 协议、排序字段变更)。
---
## 小但容易踩坑的细节(低到中优先级)
* 时区:截止时间、提醒、统计按用户时区还是租户时区?
* 删除语义:软删/硬删/归档的区别;是否支持恢复;审计日志保留多久。
* 限流与防刷登录、搜索、Webhook 回调都需要限流与签名验证。
* Webhook重试、签名、回调失败处理、事件订阅管理页面。
---
# 补全要点(建议方案)
## 1) 微服务拆分的时序与边界
- MVP 采用“模块化单体”,对外保持 REST 接口一致;阶段 4 再按服务拆分,避免过早复杂化。
- 个人任务与团队任务复用统一任务模型,权限/可见性通过资源归属owner_id/team_id区分。
## 2) 权限模型
- 采用 RBAC + 资源级权限控制。
- 团队角色Owner/Admin/Member/Viewer资源级权限read/write/manage/comment。
## 3) JWT + Refresh Token 细节
- Access Token 放 HeaderRefresh Token 放 httpOnly Cookie。
- 每设备一份 Refresh Token开启 rotation + reuse detection支持即时注销服务端黑名单/版本号)。
- Cookie 场景启用 CSRF TokenHeader 场景启用 CSP/XSS 防护策略。
## 4) 实时同步与离线
- 服务端为真相源乐观并发控制version 字段),冲突默认 last-write-wins可选手动合并。
- 离线采用 oplog操作日志重放使用幂等键避免重复创建/通知。
## 5) 排序/拖拽
- 采用稠密 rank如 1.0、1.5、2.0)策略;必要时批量重排。
- 并发拖拽冲突:按 version + rank 重新计算并回传最新排序。
## 6) 事件流Kafka
- 事件task.created/updated/completed/deleted, reminder.due, team.member.changed。
- 订阅:通知服务、搜索服务、统计服务;统一幂等键 + 重试 + 死信队列。
## 7) 多租户隔离
- 同库同表 + tenant_id联合索引tenant_id, user_id, status, due_at
- 支持租户级数据导出与清理(软删 + 异步物理清理)。
## 8) 搜索一致性与权限
- 索引异步更新,允许短暂不一致;删除走补偿任务。
- 搜索权限:索引内嵌 ACL 字段team_id、member_ids、visibility查询时过滤。
## 9) 统计分析数据源
- 统计基于事件流汇总,落地到统计表或 OLAP。
- 指标口径:归档不计入活跃任务,重复任务按实例统计。
## 10) 附件链路
- 对象存储S3/MinIO上传采用预签名直传。
- 下载走鉴权签名 URL限制类型/大小,可选病毒扫描。
## 11) REST 内部调用与版本
- 服务调用设置超时、重试、熔断、限流;使用统一 client 中间件。
- API 版本:/v1OpenAPI 与版本绑定。
## 12) 幂等性与一致性
- 写请求支持 Idempotency-Key。
- 跨服务操作采用“至少一次”语义,消费端保证幂等。
## 13) 可观测性约定
- traceId 贯穿网关→服务→Kafka统一结构化日志字段与脱敏策略。
- 关键指标:登录失败率、任务写入错误率、事件积压、搜索延迟。
## 14) 测试分层
- 单元 + 集成 + 端到端 + 契约测试(服务间)。
- 离线/冲突/实时同步采用固定场景回归集。
## 15) 数据迁移与灰度
- 迁移工具goose 或 atlas遵循向前兼容。
- 灰度发布支持旧客户端兼容Token、字段、排序策略

107
docs/overview.md Normal file
View File

@@ -0,0 +1,107 @@
# Todolist 全功能应用计划
## 目标与范围
构建一个“复杂但可靠”的 Todo 应用,覆盖前后端、鉴权、权限、数据一致性、性能与观测等完整链路,满足生产级实践。
- 支持个人/团队任务管理
- 分布式微服务架构Kubernetes 部署
- 网页/小程序/移动端 多端适配
## 功能规划
### 1. 用户与权限
- 用户注册/登录/退出
- JWT + Refresh Token 机制
- 角色权限(普通用户/管理员)
- 多租户可选(组织/团队)
### 2. 任务管理(核心)
- 任务 CRUD标题/描述/截止时间/优先级/标签/附件)
- 任务状态流转(待办/进行中/完成/归档)
- 子任务、多级任务
- 任务排序、拖拽
- 批量操作
### 3. 数据同步与协作
- 实时同步WebSocket/Server-Sent Events
- 冲突处理与版本号控制
- 离线缓存与恢复
### 4. 通知与提醒
- 站内通知、邮件通知、Webhook
- 定时提醒cron/队列驱动)
### 5. 搜索与分析
- 全文检索
- 任务完成度、统计报表
- 活跃度/时间分布
---
## 技术架构
### 服务划分(微服务)
- 网关/API Gateway统一入口、路由、鉴权前置、限流
- 认证服务(登录、注册、令牌、会话)
- 用户服务(用户资料、偏好)
- 个人任务服务(个人任务、标签、提醒)
- 团队服务(团队/组织、成员、角色)
- 团队任务服务(团队任务、协作、权限)
- 通知服务(站内/邮件/Webhook
- 搜索服务(索引与查询)
- 统计分析服务(报表、指标)
- 通信协议:统一使用 HTTP RESTful
### 前端
- 框架Vue 3 + Vite + TypeScript
- 状态管理Pinia
- UI自定义设计系统 + Tailwind / Radix
- 路由Vue Router
- 数据请求TanStack QueryVue
### 后端
- 语言Go
- Web 框架Gin
- DBPostgreSQL
- ORM/数据访问GORM + sqlc学习对比混合使用
- 缓存Redis
- 搜索Elastic
- 消息队列Kafka
### 中间件/基础设施
- 鉴权中间件JWT/Session
- 日志与监控Zap + Prometheus + Grafana
- 链路追踪OpenTelemetry
- 配置管理Viper
- 容器化与编排Docker + Kubernetes
- 服务发现与配置K8s Service/ConfigMap/Secret
---
## 分阶段实施计划
### 阶段 1核心 MVP
- 用户注册/登录
- 任务 CRUD
- 基础列表/详情页面
- 基础权限控制
### 阶段 2增强功能
- 子任务、多标签
- 搜索功能
- 任务统计报表
### 阶段 3协作与实时
- WebSocket 实时同步
- 冲突处理机制
- 离线缓存支持
### 阶段 4运维与优化
- 监控报警
- CI/CD 自动化
- 性能优化与安全审计
- 微服务拆分与 K8s 部署(服务编排、网关、灰度发布)
---
## 测试与交付
- 单元测试、集成测试
- API 文档OpenAPI
- 端到端测试Cypress/Playwright