有赞 APP IM SDK 组件架构设计

本文主要以 Android 客户端为例,记录了有赞旗下 App 中使用自研 IM SDK 设计思路,由有赞移动开发组 IM SDK 团队共同讨论完成。

背景

在有赞产品中,存在大量需要交易双方沟通交流的场景,比如,客户咨询商家产品信息,售前售后简单的答疑和维权等。另外,有赞业务还存在一些特殊的复杂场景,如供应商,分销商,客户三方之间需要同步沟通,会同时存在多种沟通角色。此时需要较为完善的即时通信(IM)解决方案,但是由于有赞针对不同的商户和使用场景有多个 APP,APP 自行实现 IM 功能代价较大,且维护起来人力分散,于是,IM SDK 项目便应运而生了,APP 通过接入此 SDK,可以快速实现 IM 基本功能。

设计目标

  • IM 主流程稳定可用:消息传输具有高可靠性。
  • UI 组件直接集成进入 SDK,并支持可定制化。
  • 富媒体发送集成进入 SDK,并可按需定制需要的富媒体类型。
  • 实现消息传输层 SDK,与带有 UI 的 SDK 的功能分离,业务调用方既可以使用消息传输 SDK,处理消息,然后自行处理 UI,也可以使用带有 UI 组件的 SDK,一步实现较为完备的 IM 功能。

整体结构

下图中简要描述了有赞客户端中 IM 系统的基本结构

  • 消息通道层:维护 Socket 长连接作为消息通道,消息收发流程主要在这一层中完成。
  • 持久化层:主要将消息存入数据库中,富媒体文件存入文件缓存中,方便第二次展示消息时候,从本地加载,而不是网络层获取。
  • 逻辑处理层:完成各种消息相关的逻辑处理,如排序,富媒体文件的预处理等。
  • UI 显示层:将数据在 UI 上进行呈现。

设计要点

此章节中主要描述了,IM SDK 设计中一些重要流程。

Socket 长连接的创建与维护

IM SDK 所有数据收发流程,均通过 Socket 长连接完成,如何维护一个稳定 Socket 通道,是 IM 系统是否稳定的重要一环。 下面描述下 Socket 通道几个重要的流程
  • 创建流程(连接)

    如图所示,当 IM SDK 初始化后,业务调用连接请求接口,会开始连接的创建过程,创建成功后,会完成鉴权操作,当创建和鉴权都完成后,会开启消息收发线程,为了维持长连接,会有心跳机制,特别的,会开启一个心跳轮询线程。

  • 心跳
    心跳机制,是 IM 系统设计中的常见概念,简单的解释就是每隔若干时间发送一个固定信息给服务端,服务端收到后及时回复一个固定信息,如果服务端若干时间内没有收到客户端心跳信息则视客户端断开,同理如果客户端若干时间没有收到服务端心跳回值则视服务端断开。

    当长连接创建成功后,会开启一个轮询线程,每隔一段时间发送心跳消息给服务器端,以维持长连接。

  • 重连流程

    重连被触发时,如果该次连接成功,退出重连。反之重连失败后,会判断当前重连的次数是否超过预期值(这里设为 6 次),并对重连次数计数,如果超过就会退出重连,反之休眠预设的时间后再次进行重连操作。
    重连触发条件分为三种:

  • 主动连接不成功(主动连接 Socket,如果连接失败,会触发重连机制 )
  • 网络被主动断开(正常建立连接,操作过程中,网络被断开,通过系统广播触发重连)
  • 服务器没响应,心跳没回值(服务端心跳预设时间内没回值,客户端认为服务端已经断开,触发重连)
  • 网络状态判断
    TCP API 并没有提供一个可靠的方法判断当前长连接通道状态,isConnected()和 isClosed() 仅仅告诉你当前的 Socket 状态,不是是长连接断开是一回事。
    isConnected()告诉你是否 Socket 与 Romote host 保持连接,isClosed() 告诉你是否 Socket 被关闭。
    假如你判断长连接通道是否被关闭,只能通过和流操作相关的以下方法:

    1. read() return -1
    2. readLine() return null
    3. readXXX() throw EOPException for any other XXX
    4. write 将抛出 IOException: Broken pipe(通道被关闭)

所以 SDK 封装 isConnected()方法的时候,是根据这几种情况综合判断当前的通道状态,而不是仅仅通过 Socket.isConnected()或者 Socket.isClosed()。

消息发送流程

![](/content/images/2016/04/-------1.png) 消息发送流程主要有两大类,一类是 IM 相关数据的请求,例如:历史消息列表,会话列表等,另一类是 IM 消息的发送,主要是文字消息。(富媒体消息发送,会将富媒体文件先上传服务器后,拿到文件 URL, 通过文字消息,将此 URL 发给接收方,接收方下载后进行 UI 展示)。 此两类消息发送,均使用上图的流程进行发送,可通过发送回调感知请求的结果。

如图所示,消息发送流程,需要先封装消息请求,在通过发送队列发送至服务器,发送前,在将请求 id 和对应回调存入本地 Map 数据结构中。

if (requestCallBack != null) {
  mCallBackMap.put(requestId, requestCallBack);
}

之后接收服务器推送消息(此消息带有发送请求时的请求 id),在本地的 Map 数据找到请求 id 对应的回调,然后通过回调返回服务器推送过来的数据。
请求可以通过泛型指定返回值类型,SDK 中会自行解析服务器数据返回的数据,直接返回给业务调用方 model 对象,方便使用。(目前支持 json 格式的数据解析)

private void IMResponseOnSuccess(String requestid, String response) {
		if (mCallBackMap != null) {
		   IMCallBack callBack = mCallBackMap.get(requestid);
		   if (callBack == null) {
		       return;
		   }
		   if (callBack instanceof JsonResultCallback) {
		       final JsonResultCallback resultCallback = (JsonResultCallback) callBack;
		       if (resultCallback.mType == String.class) {
		           callBack.onResponse(response);
		       } else {
		           Object object = new Gson().fromJson(response, resultCallback.mType);
		           callBack.onResponse(object);
		       }
		       removeCallBack(requestid);
		   }
		}
}

如下的示例中,展示了一个获取会话列表的请求,可以看出目前的请求封装,和一些第三方的的网络库类似,使用起来较为方便。

RequestApi requestApi = new RequestApi(IMConstant.REQ_TYPE_GET_CONVERSATION_LIST, EnumsManager.IMType.IM_TYPE_WSC.getRequestChannel());

requestApi.addRequestParams("limit", 100);
requestApi.addRequestParams("offset", 0);

IMEngine.getInstance().request(requestApi, new JsonResultCallback<List<ConversationEntity>>() {
    @Override
    public void onResponse(List<ConversationEntity> response) {
        mSwipeRefreshLayout.setRefreshing(false);
        mAdapter.mDataset.clear();
        mAdapter.mDataset.addAll(response);
        mAdapter.notifyDataSetChanged();
    }

    @Override
    public void onError(int statusCode) {
        //do something
    }
});  

可以看出,该请求直接返回了一个会话类型的 List 集合,业务方可直接使用。

消息接收流程

![](/content/images/2016/04/-------3.png)

消息的监听流程主要使用了一个全局监听的方式来进行,需要先注册监听器,监听器中有默认的回调。

public interface IMListener {
    /**
     * 连接成功
     */
    void connectSuccess();

    /**
     * 连接失败
     */
    void connectFailure(EnumsManager.DisconnectType type);
 
    /**
     * 鉴权成功
     */
    void authorSuccess();
 
    /**
     * 鉴权失败
     */
    void authorFailure();
 
    /**
     * 接收数据成功
     */
    void receiveSuccess(int reqType, String msgId, String requestChannel, String message, int statusCode);

    /**
     * 接收数据失败
     */
    void receiveError(int reqType, String msgId, String requestChannel, int statusCode);
}

该监听器中可以接收如下类型的消息:

  • Socket 连接状态的返回结果。
  • 鉴权状态的返回结果,(鉴权流程因有赞业务需要)。
  • 接收的 IM 消息,或者其他类型的返回消息。可根据消息类型进行后续的分发处理

业务如需使用此全局监听器,需要自行实现此接口,并在业务初始化时,注册此监听器即可。SDK 中会根据注册的监听器,在读取到服务器推送消息后,直接通过监听器到回调进行分发。

private void distributeData(IMEntity imEntity) {
		if (mIMListener != null && imEntity != null) {
       // 省略部分逻辑代码
       ……
       if (status == Response.SUCCESS) {
           switch (responseModel.reqType) {
               case IMConstant.REQ_TYPE_AUTH: // 鉴权成功
                   mIMListener.authorSuccess();
                   return;

               case IMConstant.REQ_TYPE_OFFLINE: //  服务端踢客户端下线
                   mIMListener.connectFailure(EnumsManager.DisconnectType.SERVER);
                   break;

               case IMConstant.REQ_TYPE_HEARTBEAT: // 心跳成功
               case IMConstant.REQ_TYPE_RECEIVER_MSG: // 收到回调消息
                   handleMessageID(responseModel.body);
                   break;
               default:
                   break;
           }
           mIMListener.receiveSuccess(responseModel.reqType, msgId, responseModel
                   .requestChannel, responseModel.body, 0);
       } else {
           mIMListener.receiveError(responseModel.reqType, msgId, responseModel
                   .requestChannel, status);
       }
   }
}

部分接收消息,如心跳,多端登录时被踢下线通知等,sdk 内部会自行处理,业务基本无感知。

可定制化的 UI

随着公司规模的扩大与业务线的快速迭代,可能新的业务也需要 IM 这个功能,众所周知,IM UI 功能的嵌入会占据大量的开发与调试时间, 为了解决这个痛点,决定将 IM UI 部分抽成一个 Library,实现可定制与单独维护,做到真正的敏捷开发与快速迭代。

UIKit 设计

![](/content/images/2016/04/UIKit----1.png) IM UIKit 暴露相应的 api 接口,业务方注入相应的功能定制项,针对 UI 的点击回调通过 EventBus 总线 post 分发,减少了业务方与 UIKit 的耦合,底层业务方通过 MVP 模式对 View 与 Model 进行解耦。定制项一般通过如下几种方式:
  • XML(定制业务信息,资源信息,显示条数,各个业务功能开关等)
	<?xml version="1.0" encoding="utf-8"?>
	<resources>
	    <style name="limit">
	        <!--每屏展示的条数-->
	        <item name="swiplimit">5</item>
	        ......
	    </style>
		......
		......
	    <style name="itembox">
	        <item name="showvoice">true</item>
	        ......
	        ......
	        <item name="more" show="true">
	            <more>
	                <icon style="mipmap">im_plus_image</icon>
	                <itemname>测试</itemname>
	                <callback>false</callback>
	            </more>
	             ......
	             ......
	            <more>
	                <icon style="mipmap">ic_launcher</icon>
	                <itemname>测试</itemname>
	                <callback>true</callback>
	            </more>
	        </item>
	        ......
	        ......
	    </style>
	</resources>
  • Style(定制 UI 背景,气泡颜色,字体大小等)
	<?xml version="1.0" encoding="utf-8"?>
	<resources>
	    <!--im 聊天背景-->
	    <style name="imui_background">
	        <item name="android:background">@android:color/holo_red_dark</item>
	    </style>
		......
		......
	
	    <!--气泡背景-->
	    <style name="bubble_background">
	        <item name="android:background">@mipmap/bubble_right_green</item>
	    </style>
	
	       <!--背景和和字段颜色定制-->
	    <style name="bg_and_textcolor" parent="bubble_background">
	        <item name="android:textColor">@android:color/holo_red_dark</item>
	    </style>
	    ......
	    ......
	</resources>
  • Model 定制(传入预设的定制 Model 模板填入相应参数,UIKit 里面做相应解析)
	public class Entity {
	    public String action1;
	    public String action2;
	    public String aciton3;
	    ......
	}

UIKit 支持的富媒体类型

除了文字消息之外,现在主流的 IM 系统中也支持各种富媒体发送,在有赞 IM SDK UIKit 中,目前也支持几种富媒体发送。 以下是发送流程图和两类常见富媒体消息简介。
  • 语音消息
    语音消息,除了使用常见的录制和解码播放的技术之外。还利用了 AudioManagerrequestAudioFocusabandonAudioFocus 相关方法,实现了录制和播放语音消息,如果有第三方播放音乐,会自动暂停,录制和播放语音消息结束后,声音会自动播放。
  • 图片消息
    图片消息,通过七牛服务器设置了缩略图,接收方收到消息后,会先下载缩略图,当用户再点击进入图片详情页时,会下载大图,Andorid 客户端使用 Picasso 加载库加载图片,并做本地缓存。

UI 中聊天会话数据加载策略

参考业界主流的 IM 系统方案,用户聊天时,需要将已经发送和接收到的聊天信息保存到本地。而不是每次都拉取历史数据。以达到节约流量和无网络状态下也查看数据的效果。为此 IM SDK 持久化层的数据库中,也实现了简单存储加载机制,下面描述典型的数据加载场景。
  • IM 会话首次请求数据流程

  • IM 下拉获取历史数据流程

  • IM 单条消息发送持久化方案

  • IM 单条数据重发流程

设计不足之处

  • 消息回执
    当前的设计方案中,没有消息回执的机制,也就是说接受方收到消息后,不会返回服务器收到消息的通知,服务器无法判断消息是否推送成功,这样在突然断网,网络模式切换,或者弱网环境下,会影响消息的到达率。
    一种可行的设计方式是,发送方增加已送到和未送达的状态,接收方收到消息后,给服务器返回已收到消息的通知,服务器再推送给发送方该状态,如果没有收到接收方回执,服务器可尝试重新推送。发送方接受到接收方的收到回执后,更新发送状态已发送,如果未收到,则显示未送达。为了防止接收方回执丢失,接收方接收消息时候,可维护本地去重队列。

  • 本地请求超时的判断
    本地发起的请求,没有用定时器,完全依赖服务器返回或者出现 Socket 通道异常后上抛的通知作为超时判断,部分场景可能覆盖不到,需要对请求增加固定的超时处理机制,固定时候未收到请求,即认为超时。

未来发展方向

  • 增加对群聊的支持。
  • 弥补设计中的不足之处,提升消息的到达率和系统稳定性。
  • 提供有赞 App 更方便的接入方式,提供封装性更好的接口。