Skip to content

部署运维

**本文引用的文件** - [承兑平台产品方案文档.md](file://承兑平台产品方案文档.md) - [任务和测试过程/Readme.md](file://任务和测试过程/Readme.md) - [文档/Readme.md](file://文档/Readme.md) - [AI沟通记录/2026-06-05-Chat.md](file://AI沟通记录/2026-06-05-Chat.md) - [AI沟通记录/2026-06-06_沟通记录.md](file://AI沟通记录/2026-06-06_沟通记录.md) - [AI沟通记录/2026-06-08_沟通记录.md](file://AI沟通记录/2026-06-08_沟通记录.md) - [rearrange_chapters.py](file://rearrange_chapters.py) - [任务和测试过程/2026-06-05-Discussion.md](file://任务和测试过程/2026-06-05-Discussion.md) - [决策变更清单.md](file://决策变更清单.md)

目录

  1. 简介
  2. 项目结构
  3. 核心组件
  4. 架构总览
  5. 详细组件分析
  6. 依赖分析
  7. 性能考量
  8. 故障排查指南
  9. 结论
  10. 附录

简介

本文件面向承兑平台的部署与运维,围绕部署环境配置、运维监控、安全防护、应急响应、部署架构、服务器与网络拓扑、存储方案、CI/CD 流程、自动化部署、配置管理、版本发布策略、监控指标与告警、日志与性能监控、备份与灾难恢复、容量规划、运维手册与操作指南、故障排查流程、团队职责分工等方面,提供系统化、可落地的方案说明。
本项目为法币-USDT 承兑流动性平台,采用“做市商 + 流动性撮合”模式,业务以 USDT 内部记账与链上充值/提现为核心,强调高并发订单处理、风控与合规、资金安全与可审计。

项目结构

仓库包含产品方案、任务与测试过程、Axure 原型、沟通记录、Python 章节重排脚本等文档与素材。

  • 文档与方案:产品方案、任务与测试过程、沟通记录、决策变更清单等,构成平台设计与实施的权威依据。
  • 原型与前端:Axure 原型文件,用于商户端、交易员端、运营后台的功能范围与交互设计。
  • 工程化:Python 脚本用于文档章节重排,便于维护与版本演进。
mermaid
graph TB
A["项目根目录"] --> B["文档/Readme.md"]
A --> C["任务和测试过程/Readme.md"]
A --> D["AI沟通记录/*"]
A --> E["Axure老的项目原型/*"]
A --> F["rearrange_chapters.py"]
A --> G["任务和测试过程/2026-06-05-Discussion.md"]
A --> H["决策变更清单.md"]
A --> I["承兑平台产品方案文档.md"]

图表来源

  • [文档/Readme.md:1-3](file://文档/Readme.md#L1-L3)
  • [任务和测试过程/Readme.md:1-3](file://任务和测试过程/Readme.md#L1-L3)
  • [AI沟通记录/2026-06-05-Chat.md:1-33](file://AI沟通记录/2026-06-05-Chat.md#L1-L33)
  • [AI沟通记录/2026-06-06_沟通记录.md:1-52](file://AI沟通记录/2026-06-06_沟通记录.md#L1-L52)
  • [AI沟通记录/2026-06-08_沟通记录.md:1-10](file://AI沟通记录/2026-06-08_沟通记录.md#L1-L10)
  • [任务和测试过程/2026-06-05-Discussion.md:1-177](file://任务和测试过程/2026-06-05-Discussion.md#L1-L177)
  • [决策变更清单.md:1-235](file://决策变更清单.md#L1-L235)
  • [rearrange_chapters.py:1-89](file://rearrange_chapters.py#L1-L89)

章节来源

  • [文档/Readme.md:1-3](file://文档/Readme.md#L1-L3)
  • [任务和测试过程/Readme.md:1-3](file://任务和测试过程/Readme.md#L1-L3)

核心组件

  • 业务中台:订单中心、费率引擎、风控中心、营销中心、钱包中心、通知中心、数据报表中心。
  • 业务域:商户端(API/后台)、交易员端(App/H5)、运营后台(Web)、介绍人端(Web)。
  • 基础设施:数据库(PostgreSQL)、缓存(Redis)、区块链节点(QuickNode/Alchemy)、短信/邮件(Twilio/SendGrid)、多签钱包(Gnosis Safe)。
  • 安全与合规:KMS/Vault、KYC/AML、OFAC 制裁名单匹配、合规咨询。

章节来源

  • [承兑平台产品方案文档.md:295-331](file://承兑平台产品方案文档.md#L295-L331)
  • [承兑平台产品方案文档.md:497-530](file://承兑平台产品方案文档.md#L497-L530)
  • [承兑平台产品方案文档.md:598-653](file://承兑平台产品方案文档.md#L598-L653)
  • [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)

架构总览

平台采用“分层混合托管”资金架构:Layer 1(平台内部记账)、Layer 2(热钱包周转)、Layer 3(冷钱包储备),结合多签与限额管理,确保高并发下的资金安全与合规。
系统由商户端、交易员端、运营后台与业务中台组成,数据流与资金流清晰分离:商户端发起订单,平台内部完成 USDT 划转,链上仅处理充值/提现,降低 Gas 成本与延迟。

mermaid
graph TB
subgraph "客户端"
M["商户端(API/后台)"]
T["交易员端(App/H5)"]
O["运营后台(Web)"]
R["介绍人端(Web)"]
end
subgraph "业务中台"
OC["订单中心"]
FE["费率引擎"]
RC["风控中心"]
MC["营销中心"]
WC["钱包中心"]
NC["通知中心"]
DC["数据报表中心"]
end
subgraph "基础设施"
DB["数据库(PostgreSQL)"]
CACHE["缓存(Redis)"]
CHAIN["区块链节点(QuickNode/Alchemy)"]
SMS["短信/邮件(Twilio/SendGrid)"]
SAFE["多签钱包(Gnosis Safe)"]
KMS["密钥管理(AWS KMS/HashiCorp Vault)"]
end
M --> OC
T --> OC
O --> OC
R --> OC
OC --> FE
OC --> RC
OC --> MC
OC --> WC
OC --> NC
OC --> DC
WC --> CHAIN
WC --> SAFE
WC --> KMS
OC --> DB
OC --> CACHE
NC --> SMS

图表来源

  • [承兑平台产品方案文档.md:295-331](file://承兑平台产品方案文档.md#L295-L331)
  • [承兑平台产品方案文档.md:497-530](file://承兑平台产品方案文档.md#L497-L530)
  • [承兑平台产品方案文档.md:598-653](file://承兑平台产品方案文档.md#L598-L653)
  • [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)

详细组件分析

1) 部署架构与服务器配置

  • 服务器角色与职责
    • API/应用服务器:运行订单中心、费率引擎、钱包中心等核心服务,承载高并发订单处理与实时风控。
    • 数据库服务器:PostgreSQL 主库与只读副本,支持读写分离与备份恢复。
    • 缓存服务器:Redis 集群,支撑会话、限流、队列与热点数据。
    • 区块链节点:QuickNode/Alchemy 或自建节点,监听充值确认与链上事件。
    • 通知服务:短信/邮件网关,集成 Twilio/SendGrid。
    • 安全与密钥:KMS/Vault 管理私钥与敏感配置。
  • 网络拓扑
    • 前置负载均衡器(Nginx/Tengine)分发流量至应用集群。
    • 内部通过 VPC/子网隔离,数据库与缓存置于内网,仅应用服务器访问。
    • 区块链节点通过公网 API 访问,结合内网代理与鉴权。
  • 存储方案
    • 热数据:PostgreSQL 主库 + Redis 缓存。
    • 冷数据:离线备份与归档,支持增量与全量备份。
    • 钱包与密钥:冷热分离,私钥多签保管,热钱包仅保留周转金。

章节来源

  • [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)
  • [承兑平台产品方案文档.md:598-653](file://承兑平台产品方案文档.md#L598-L653)

2) CI/CD 流程与自动化部署

  • 版本与分支策略
    • main:稳定发布分支,每次发布打标签并记录变更。
    • develop:集成分支,每日构建与冒烟测试。
    • feature/*:功能分支,合并前需代码评审与单元测试。
  • 构建与测试
    • 代码检查(lint)、单元测试、集成测试、API 测试。
    • Docker 镜像构建,镜像扫描与漏洞检测。
  • 部署与回滚
    • 蓝绿/滚动发布,灰度流量切换,失败自动回滚。
    • 配置管理:环境变量与密钥通过 KMS/Vault 注入,避免硬编码。
  • 文档与脚本
    • Python 章节重排脚本用于维护产品方案文档结构,确保版本演进有序。
mermaid
flowchart TD
Dev["开发者提交代码"] --> PR["创建 Pull Request"]
PR --> Lint["代码检查"]
Lint --> UT["单元测试"]
UT --> IT["集成测试"]
IT --> Build["构建镜像"]
Build --> Scan["镜像扫描"]
Scan --> Deploy["蓝绿/滚动发布"]
Deploy --> Health["健康检查"]
Health --> |通过| Prod["生产环境"]
Health --> |失败| Rollback["自动回滚"]

图表来源

  • [rearrange_chapters.py:1-89](file://rearrange_chapters.py#L1-L89)

章节来源

  • [AI沟通记录/2026-06-05-Chat.md:7-32](file://AI沟通记录/2026-06-05-Chat.md#L7-L32)
  • [AI沟通记录/2026-06-06_沟通记录.md:21-51](file://AI沟通记录/2026-06-06_沟通记录.md#L21-L51)
  • [rearrange_chapters.py:1-89](file://rearrange_chapters.py#L1-L89)

3) 运维监控方案

  • 指标体系
    • 业务指标:订单吞吐、成功率、平均处理时延、超时率、风控拦截率。
    • 系统指标:CPU/内存/磁盘/网络、连接数、队列长度、缓存命中率。
    • 风控指标:异常订单占比、制裁名单命中、单卡收款上限触发次数。
  • 告警机制
    • 分级告警:P0(服务不可用)、P1(高失败率)、P2(性能退化)、P3(常规监控)。
    • 多通道通知:邮件、短信、IM(钉钉/飞书),并支持静默窗口与抑制规则。
  • 日志管理
    • 结构化日志:统一字段、时间戳、TraceID、模块、级别、上下文。
    • 日志采集:Filebeat/Fluent Bit 收集,集中存储于 ELK/EFK。
    • 审计日志:资金操作、风控决策、配置变更等关键动作留痕。
  • 性能监控
    • APM:全链路追踪、慢调用分析、依赖关系图。
    • 压测:定期压测,识别瓶颈并优化。

章节来源

  • [承兑平台产品方案文档.md:782-791](file://承兑平台产品方案文档.md#L782-L791)

4) 安全防护措施

  • 访问控制
    • API 访问:IP 白名单、签名(HMAC-SHA256)、速率限制、2FA。
    • 内部访问:VPN/堡垒机、最小权限、定期权限审计。
  • 数据安全
    • 敏感数据加密:传输加密(TLS)、静态加密(KMS),密钥轮换。
    • 日志脱敏:PII/账户信息脱敏处理。
  • 应用安全
    • 输入校验、参数化查询、XSS/CSRF 防护、依赖漏洞扫描。
  • 区块链安全
    • 多签钱包、热钱包限额、链上交易确认阈值、异常地址监控。
  • 合规与审计
    • KYC/AML、OFAC 名单、旅行规则数据采集、合规咨询与审计。

章节来源

  • [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)
  • [决策变更清单.md:142-164](file://决策变更清单.md#L142-L164)

5) 应急响应预案

  • 事件分级与处置
    • P0:服务中断,立即启用备用节点、回滚、隔离故障模块。
    • P1:订单积压/风控误判,扩容、人工干预、临时规则开关。
    • P2:性能退化,限流、降级、缓存预热。
    • P3:常规告警,记录与复盘。
  • 灾难恢复
    • RTO/RPO:核心服务 RTO≤15 分钟,RPO≤5 分钟。
    • 多活:同城双活+异地容灾,自动切换与手动接管。
    • 热备:数据库、缓存、应用实例热备,快速接管。
  • 业务连续性
    • 交易时段控制:平台层与交易员层双层控制,保障合规与风控。
    • 备用通道:短信/邮件备用通道,确保通知可达。

章节来源

  • [承兑平台产品方案文档.md:782-791](file://承兑平台产品方案文档.md#L782-L791)
  • [决策变更清单.md:167-198](file://决策变更清单.md#L167-L198)

6) 备份恢复与容量规划

  • 备份策略
    • 数据库:全量+增量备份,保留 7-14 天,异地存储。
    • 配置与日志:版本化存储,保留 30 天。
    • 钱包与密钥:离线冷备份,多副本分散存放。
  • 恢复演练
    • 定期演练 RTO/RPO,验证恢复流程与数据一致性。
  • 容量规划
    • 业务容量:基于峰值订单量、并发连接数、缓存命中率预测。
    • 基础设施容量:CPU/内存/磁盘/带宽按峰值×1.5~2 预留冗余。
    • 存储容量:热数据按 30 天日均增长,冷数据按 12 个月归档。

章节来源

  • [承兑平台产品方案文档.md:598-653](file://承兑平台产品方案文档.md#L598-L653)

7) 运维手册与操作指南

  • 常见操作
    • 环境切换:开发/测试/预生产/生产,区分配置与密钥。
    • 配置变更:灰度发布、回滚、变更记录与审批。
    • 热点问题:订单积压、风控误判、链上确认延迟、短信/邮件失败。
  • 故障排查流程
    • 快速定位:日志检索、APM 调用链、指标异常区间。
    • 逐步隔离:服务依赖、数据库连接、缓存命中、外部依赖。
    • 修复与验证:修复后回归测试与灰度验证。
  • 团队职责
    • SRE:系统稳定性、容量与性能、自动化与监控。
    • DBA:数据库运维、备份与恢复、性能优化。
    • 平台工程师:应用发布、配置管理、容器编排。
    • 安全工程师:安全策略、漏洞扫描、合规审计。
    • 运营:业务监控、风控策略、应急处置。

章节来源

  • [任务和测试过程/2026-06-05-Discussion.md:1-177](file://任务和测试过程/2026-06-05-Discussion.md#L1-L177)

依赖分析

  • 组件耦合
    • 订单中心与钱包中心强耦合(冻结/释放),需保证事务一致性。
    • 费率引擎与风控中心弱耦合,通过事件或查询接口交互。
    • 通知中心依赖短信/邮件网关,需多通道兜底。
  • 外部依赖
    • 区块链节点稳定性直接影响充值确认与提现链上执行。
    • KYC/AML 与制裁名单服务的可用性与准确性。
  • 循环依赖
    • 通过接口契约与事件驱动避免循环依赖,确保可演进。
mermaid
graph LR
OC["订单中心"] --> WC["钱包中心"]
OC --> FE["费率引擎"]
OC --> RC["风控中心"]
OC --> NC["通知中心"]
WC --> CHAIN["区块链节点"]
RC --> KYC["KYC/AML"]
RC --> OFAC["OFAC 名单"]
NC --> SMS["短信/邮件"]

图表来源

  • [承兑平台产品方案文档.md:497-530](file://承兑平台产品方案文档.md#L497-L530)
  • [承兑平台产品方案文档.md:656-694](file://承兑平台产品方案文档.md#L656-L694)

章节来源

  • [承兑平台产品方案文档.md:497-530](file://承兑平台产品方案文档.md#L497-L530)

性能考量

  • 订单处理性能
    • 使用连接池与读写分离,热点订单按 ID 分片。
    • 缓存高频数据(汇率、费率、用户状态),设置合理过期策略。
  • 链上交互性能
    • 充值监听异步化,批量确认与去重,避免重复入账。
    • 提现采用队列化处理,多签审批与链上广播解耦。
  • 风控与合规
    • 风控规则引擎异步化,结果缓存与批量计算。
    • 合规数据采集与上报异步化,避免阻塞主流程。

[本节为通用指导,无需特定文件引用]

故障排查指南

  • 订单异常
    • 订单长时间未处理:检查风控拦截、链上确认、通知失败。
    • 订单金额不符:核查汇率与手续费计算、用户上传凭证。
  • 钱包与资金
    • 充值未到账:检查链上确认数、地址与 Memo、监听服务。
    • 提现失败:检查多签状态、限额与白名单、链上费用。
  • 系统与性能
    • 服务不可用:检查负载均衡、健康检查、数据库连接池。
    • 性能退化:分析慢调用、缓存命中率、队列堆积。
  • 安全与合规
    • API 异常:检查签名、白名单、速率限制、2FA。
    • 合规告警:核查 KYC/AML 与制裁名单匹配结果。

章节来源

  • [承兑平台产品方案文档.md:782-791](file://承兑平台产品方案文档.md#L782-L791)

结论

本运维文档基于产品方案与任务清单,构建了覆盖部署、监控、安全、应急、备份与容量的全栈运维体系。通过分层混合托管、严格的 CI/CD 与配置管理、完善的监控与告警、以及清晰的应急流程,平台可在高并发与强合规环境下稳定运行,并为后续规模化与国际化提供坚实基础。

[本节为总结,无需特定文件引用]

附录

  • 术语
    • USDT:泰达币,平台内计价与结算币种。
    • 多签:由多人共同授权的数字资产管理机制。
    • KYC/AML:了解你的客户与反洗钱。
    • Webhook:平台回调商户系统的事件通知机制。
  • 参考文档
    • 产品方案、任务与测试过程、沟通记录、决策变更清单等。

章节来源

  • [承兑平台产品方案文档.md:795-800](file://承兑平台产品方案文档.md#L795-L800)
  • [任务和测试过程/Readme.md:1-3](file://任务和测试过程/Readme.md#L1-L3)
  • [文档/Readme.md:1-3](file://文档/Readme.md#L1-L3)