Appearance
部署运维
**本文引用的文件** - [承兑平台产品方案文档.md](file://承兑平台产品方案文档.md) - [任务和测试过程/Readme.md](file://任务和测试过程/Readme.md) - [文档/Readme.md](file://文档/Readme.md) - [AI沟通记录/2026-06-05-Chat.md](file://AI沟通记录/2026-06-05-Chat.md) - [AI沟通记录/2026-06-06_沟通记录.md](file://AI沟通记录/2026-06-06_沟通记录.md) - [AI沟通记录/2026-06-08_沟通记录.md](file://AI沟通记录/2026-06-08_沟通记录.md) - [rearrange_chapters.py](file://rearrange_chapters.py) - [任务和测试过程/2026-06-05-Discussion.md](file://任务和测试过程/2026-06-05-Discussion.md) - [决策变更清单.md](file://决策变更清单.md)目录
简介
本文件面向承兑平台的部署与运维,围绕部署环境配置、运维监控、安全防护、应急响应、部署架构、服务器与网络拓扑、存储方案、CI/CD 流程、自动化部署、配置管理、版本发布策略、监控指标与告警、日志与性能监控、备份与灾难恢复、容量规划、运维手册与操作指南、故障排查流程、团队职责分工等方面,提供系统化、可落地的方案说明。
本项目为法币-USDT 承兑流动性平台,采用“做市商 + 流动性撮合”模式,业务以 USDT 内部记账与链上充值/提现为核心,强调高并发订单处理、风控与合规、资金安全与可审计。
项目结构
仓库包含产品方案、任务与测试过程、Axure 原型、沟通记录、Python 章节重排脚本等文档与素材。
- 文档与方案:产品方案、任务与测试过程、沟通记录、决策变更清单等,构成平台设计与实施的权威依据。
- 原型与前端:Axure 原型文件,用于商户端、交易员端、运营后台的功能范围与交互设计。
- 工程化:Python 脚本用于文档章节重排,便于维护与版本演进。
mermaid
graph TB
A["项目根目录"] --> B["文档/Readme.md"]
A --> C["任务和测试过程/Readme.md"]
A --> D["AI沟通记录/*"]
A --> E["Axure老的项目原型/*"]
A --> F["rearrange_chapters.py"]
A --> G["任务和测试过程/2026-06-05-Discussion.md"]
A --> H["决策变更清单.md"]
A --> I["承兑平台产品方案文档.md"]图表来源
- [文档/Readme.md:1-3](file://文档/Readme.md#L1-L3)
- [任务和测试过程/Readme.md:1-3](file://任务和测试过程/Readme.md#L1-L3)
- [AI沟通记录/2026-06-05-Chat.md:1-33](file://AI沟通记录/2026-06-05-Chat.md#L1-L33)
- [AI沟通记录/2026-06-06_沟通记录.md:1-52](file://AI沟通记录/2026-06-06_沟通记录.md#L1-L52)
- [AI沟通记录/2026-06-08_沟通记录.md:1-10](file://AI沟通记录/2026-06-08_沟通记录.md#L1-L10)
- [任务和测试过程/2026-06-05-Discussion.md:1-177](file://任务和测试过程/2026-06-05-Discussion.md#L1-L177)
- [决策变更清单.md:1-235](file://决策变更清单.md#L1-L235)
- [rearrange_chapters.py:1-89](file://rearrange_chapters.py#L1-L89)
章节来源
- [文档/Readme.md:1-3](file://文档/Readme.md#L1-L3)
- [任务和测试过程/Readme.md:1-3](file://任务和测试过程/Readme.md#L1-L3)
核心组件
- 业务中台:订单中心、费率引擎、风控中心、营销中心、钱包中心、通知中心、数据报表中心。
- 业务域:商户端(API/后台)、交易员端(App/H5)、运营后台(Web)、介绍人端(Web)。
- 基础设施:数据库(PostgreSQL)、缓存(Redis)、区块链节点(QuickNode/Alchemy)、短信/邮件(Twilio/SendGrid)、多签钱包(Gnosis Safe)。
- 安全与合规:KMS/Vault、KYC/AML、OFAC 制裁名单匹配、合规咨询。
章节来源
- [承兑平台产品方案文档.md:295-331](file://承兑平台产品方案文档.md#L295-L331)
- [承兑平台产品方案文档.md:497-530](file://承兑平台产品方案文档.md#L497-L530)
- [承兑平台产品方案文档.md:598-653](file://承兑平台产品方案文档.md#L598-L653)
- [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)
架构总览
平台采用“分层混合托管”资金架构:Layer 1(平台内部记账)、Layer 2(热钱包周转)、Layer 3(冷钱包储备),结合多签与限额管理,确保高并发下的资金安全与合规。
系统由商户端、交易员端、运营后台与业务中台组成,数据流与资金流清晰分离:商户端发起订单,平台内部完成 USDT 划转,链上仅处理充值/提现,降低 Gas 成本与延迟。
mermaid
graph TB
subgraph "客户端"
M["商户端(API/后台)"]
T["交易员端(App/H5)"]
O["运营后台(Web)"]
R["介绍人端(Web)"]
end
subgraph "业务中台"
OC["订单中心"]
FE["费率引擎"]
RC["风控中心"]
MC["营销中心"]
WC["钱包中心"]
NC["通知中心"]
DC["数据报表中心"]
end
subgraph "基础设施"
DB["数据库(PostgreSQL)"]
CACHE["缓存(Redis)"]
CHAIN["区块链节点(QuickNode/Alchemy)"]
SMS["短信/邮件(Twilio/SendGrid)"]
SAFE["多签钱包(Gnosis Safe)"]
KMS["密钥管理(AWS KMS/HashiCorp Vault)"]
end
M --> OC
T --> OC
O --> OC
R --> OC
OC --> FE
OC --> RC
OC --> MC
OC --> WC
OC --> NC
OC --> DC
WC --> CHAIN
WC --> SAFE
WC --> KMS
OC --> DB
OC --> CACHE
NC --> SMS图表来源
- [承兑平台产品方案文档.md:295-331](file://承兑平台产品方案文档.md#L295-L331)
- [承兑平台产品方案文档.md:497-530](file://承兑平台产品方案文档.md#L497-L530)
- [承兑平台产品方案文档.md:598-653](file://承兑平台产品方案文档.md#L598-L653)
- [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)
详细组件分析
1) 部署架构与服务器配置
- 服务器角色与职责
- API/应用服务器:运行订单中心、费率引擎、钱包中心等核心服务,承载高并发订单处理与实时风控。
- 数据库服务器:PostgreSQL 主库与只读副本,支持读写分离与备份恢复。
- 缓存服务器:Redis 集群,支撑会话、限流、队列与热点数据。
- 区块链节点:QuickNode/Alchemy 或自建节点,监听充值确认与链上事件。
- 通知服务:短信/邮件网关,集成 Twilio/SendGrid。
- 安全与密钥:KMS/Vault 管理私钥与敏感配置。
- 网络拓扑
- 前置负载均衡器(Nginx/Tengine)分发流量至应用集群。
- 内部通过 VPC/子网隔离,数据库与缓存置于内网,仅应用服务器访问。
- 区块链节点通过公网 API 访问,结合内网代理与鉴权。
- 存储方案
- 热数据:PostgreSQL 主库 + Redis 缓存。
- 冷数据:离线备份与归档,支持增量与全量备份。
- 钱包与密钥:冷热分离,私钥多签保管,热钱包仅保留周转金。
章节来源
- [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)
- [承兑平台产品方案文档.md:598-653](file://承兑平台产品方案文档.md#L598-L653)
2) CI/CD 流程与自动化部署
- 版本与分支策略
- main:稳定发布分支,每次发布打标签并记录变更。
- develop:集成分支,每日构建与冒烟测试。
- feature/*:功能分支,合并前需代码评审与单元测试。
- 构建与测试
- 代码检查(lint)、单元测试、集成测试、API 测试。
- Docker 镜像构建,镜像扫描与漏洞检测。
- 部署与回滚
- 蓝绿/滚动发布,灰度流量切换,失败自动回滚。
- 配置管理:环境变量与密钥通过 KMS/Vault 注入,避免硬编码。
- 文档与脚本
- Python 章节重排脚本用于维护产品方案文档结构,确保版本演进有序。
mermaid
flowchart TD
Dev["开发者提交代码"] --> PR["创建 Pull Request"]
PR --> Lint["代码检查"]
Lint --> UT["单元测试"]
UT --> IT["集成测试"]
IT --> Build["构建镜像"]
Build --> Scan["镜像扫描"]
Scan --> Deploy["蓝绿/滚动发布"]
Deploy --> Health["健康检查"]
Health --> |通过| Prod["生产环境"]
Health --> |失败| Rollback["自动回滚"]图表来源
- [rearrange_chapters.py:1-89](file://rearrange_chapters.py#L1-L89)
章节来源
- [AI沟通记录/2026-06-05-Chat.md:7-32](file://AI沟通记录/2026-06-05-Chat.md#L7-L32)
- [AI沟通记录/2026-06-06_沟通记录.md:21-51](file://AI沟通记录/2026-06-06_沟通记录.md#L21-L51)
- [rearrange_chapters.py:1-89](file://rearrange_chapters.py#L1-L89)
3) 运维监控方案
- 指标体系
- 业务指标:订单吞吐、成功率、平均处理时延、超时率、风控拦截率。
- 系统指标:CPU/内存/磁盘/网络、连接数、队列长度、缓存命中率。
- 风控指标:异常订单占比、制裁名单命中、单卡收款上限触发次数。
- 告警机制
- 分级告警:P0(服务不可用)、P1(高失败率)、P2(性能退化)、P3(常规监控)。
- 多通道通知:邮件、短信、IM(钉钉/飞书),并支持静默窗口与抑制规则。
- 日志管理
- 结构化日志:统一字段、时间戳、TraceID、模块、级别、上下文。
- 日志采集:Filebeat/Fluent Bit 收集,集中存储于 ELK/EFK。
- 审计日志:资金操作、风控决策、配置变更等关键动作留痕。
- 性能监控
- APM:全链路追踪、慢调用分析、依赖关系图。
- 压测:定期压测,识别瓶颈并优化。
章节来源
- [承兑平台产品方案文档.md:782-791](file://承兑平台产品方案文档.md#L782-L791)
4) 安全防护措施
- 访问控制
- API 访问:IP 白名单、签名(HMAC-SHA256)、速率限制、2FA。
- 内部访问:VPN/堡垒机、最小权限、定期权限审计。
- 数据安全
- 敏感数据加密:传输加密(TLS)、静态加密(KMS),密钥轮换。
- 日志脱敏:PII/账户信息脱敏处理。
- 应用安全
- 输入校验、参数化查询、XSS/CSRF 防护、依赖漏洞扫描。
- 区块链安全
- 多签钱包、热钱包限额、链上交易确认阈值、异常地址监控。
- 合规与审计
- KYC/AML、OFAC 名单、旅行规则数据采集、合规咨询与审计。
章节来源
- [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)
- [决策变更清单.md:142-164](file://决策变更清单.md#L142-L164)
5) 应急响应预案
- 事件分级与处置
- P0:服务中断,立即启用备用节点、回滚、隔离故障模块。
- P1:订单积压/风控误判,扩容、人工干预、临时规则开关。
- P2:性能退化,限流、降级、缓存预热。
- P3:常规告警,记录与复盘。
- 灾难恢复
- RTO/RPO:核心服务 RTO≤15 分钟,RPO≤5 分钟。
- 多活:同城双活+异地容灾,自动切换与手动接管。
- 热备:数据库、缓存、应用实例热备,快速接管。
- 业务连续性
- 交易时段控制:平台层与交易员层双层控制,保障合规与风控。
- 备用通道:短信/邮件备用通道,确保通知可达。
章节来源
- [承兑平台产品方案文档.md:782-791](file://承兑平台产品方案文档.md#L782-L791)
- [决策变更清单.md:167-198](file://决策变更清单.md#L167-L198)
6) 备份恢复与容量规划
- 备份策略
- 数据库:全量+增量备份,保留 7-14 天,异地存储。
- 配置与日志:版本化存储,保留 30 天。
- 钱包与密钥:离线冷备份,多副本分散存放。
- 恢复演练
- 定期演练 RTO/RPO,验证恢复流程与数据一致性。
- 容量规划
- 业务容量:基于峰值订单量、并发连接数、缓存命中率预测。
- 基础设施容量:CPU/内存/磁盘/带宽按峰值×1.5~2 预留冗余。
- 存储容量:热数据按 30 天日均增长,冷数据按 12 个月归档。
章节来源
- [承兑平台产品方案文档.md:598-653](file://承兑平台产品方案文档.md#L598-L653)
7) 运维手册与操作指南
- 常见操作
- 环境切换:开发/测试/预生产/生产,区分配置与密钥。
- 配置变更:灰度发布、回滚、变更记录与审批。
- 热点问题:订单积压、风控误判、链上确认延迟、短信/邮件失败。
- 故障排查流程
- 快速定位:日志检索、APM 调用链、指标异常区间。
- 逐步隔离:服务依赖、数据库连接、缓存命中、外部依赖。
- 修复与验证:修复后回归测试与灰度验证。
- 团队职责
- SRE:系统稳定性、容量与性能、自动化与监控。
- DBA:数据库运维、备份与恢复、性能优化。
- 平台工程师:应用发布、配置管理、容器编排。
- 安全工程师:安全策略、漏洞扫描、合规审计。
- 运营:业务监控、风控策略、应急处置。
章节来源
- [任务和测试过程/2026-06-05-Discussion.md:1-177](file://任务和测试过程/2026-06-05-Discussion.md#L1-L177)
依赖分析
- 组件耦合
- 订单中心与钱包中心强耦合(冻结/释放),需保证事务一致性。
- 费率引擎与风控中心弱耦合,通过事件或查询接口交互。
- 通知中心依赖短信/邮件网关,需多通道兜底。
- 外部依赖
- 区块链节点稳定性直接影响充值确认与提现链上执行。
- KYC/AML 与制裁名单服务的可用性与准确性。
- 循环依赖
- 通过接口契约与事件驱动避免循环依赖,确保可演进。
mermaid
graph LR
OC["订单中心"] --> WC["钱包中心"]
OC --> FE["费率引擎"]
OC --> RC["风控中心"]
OC --> NC["通知中心"]
WC --> CHAIN["区块链节点"]
RC --> KYC["KYC/AML"]
RC --> OFAC["OFAC 名单"]
NC --> SMS["短信/邮件"]图表来源
- [承兑平台产品方案文档.md:497-530](file://承兑平台产品方案文档.md#L497-L530)
- [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)
章节来源
- [承兑平台产品方案文档.md:497-530](file://承兑平台产品方案文档.md#L497-L530)
性能考量
- 订单处理性能
- 使用连接池与读写分离,热点订单按 ID 分片。
- 缓存高频数据(汇率、费率、用户状态),设置合理过期策略。
- 链上交互性能
- 充值监听异步化,批量确认与去重,避免重复入账。
- 提现采用队列化处理,多签审批与链上广播解耦。
- 风控与合规
- 风控规则引擎异步化,结果缓存与批量计算。
- 合规数据采集与上报异步化,避免阻塞主流程。
[本节为通用指导,无需特定文件引用]
故障排查指南
- 订单异常
- 订单长时间未处理:检查风控拦截、链上确认、通知失败。
- 订单金额不符:核查汇率与手续费计算、用户上传凭证。
- 钱包与资金
- 充值未到账:检查链上确认数、地址与 Memo、监听服务。
- 提现失败:检查多签状态、限额与白名单、链上费用。
- 系统与性能
- 服务不可用:检查负载均衡、健康检查、数据库连接池。
- 性能退化:分析慢调用、缓存命中率、队列堆积。
- 安全与合规
- API 异常:检查签名、白名单、速率限制、2FA。
- 合规告警:核查 KYC/AML 与制裁名单匹配结果。
章节来源
- [承兑平台产品方案文档.md:782-791](file://承兑平台产品方案文档.md#L782-L791)
结论
本运维文档基于产品方案与任务清单,构建了覆盖部署、监控、安全、应急、备份与容量的全栈运维体系。通过分层混合托管、严格的 CI/CD 与配置管理、完善的监控与告警、以及清晰的应急流程,平台可在高并发与强合规环境下稳定运行,并为后续规模化与国际化提供坚实基础。
[本节为总结,无需特定文件引用]
附录
- 术语
- USDT:泰达币,平台内计价与结算币种。
- 多签:由多人共同授权的数字资产管理机制。
- KYC/AML:了解你的客户与反洗钱。
- Webhook:平台回调商户系统的事件通知机制。
- 参考文档
- 产品方案、任务与测试过程、沟通记录、决策变更清单等。
章节来源
- [承兑平台产品方案文档.md:795-800](file://承兑平台产品方案文档.md#L795-L800)
- [任务和测试过程/Readme.md:1-3](file://任务和测试过程/Readme.md#L1-L3)
- [文档/Readme.md:1-3](file://文档/Readme.md#L1-L3)