Hi Team,
客户发现EED下游系统在北京时间8点42时就有如下的shutdown相关报错,并且之后再无EMA API的任何日志,也没有任何行情。
2022-03-08T08:42:24,344 ERROR 27442620 [pool-10-thread-1] ItemCallbackClient 1864 processStatusMsg - loggerMsg
ClientName: ItemCallbackClient
Severity: Error
Text: Received an item event with invalid message stream
Instance Name EmaConsumer_1
RsslReactor 1abfd1f9
loggerMsgEnd
2022-03-08T08:42:24,344 ERROR 27442620 [pool-10-thread-1] ChannelCallbackClient 514 reactorChannelEventCallback - loggerMsg
ClientName: ChannelCallbackClient
Severity: Error
Text: Received ChannelDown event on channel Channel
Instance Name EmaConsumer_1
RsslReactor @3e7b3e41
RsslChannel @4be8f61b
Error Id -1
Internal sysError 0
Error Location WlItemHandler.dispatch
Error text ReactorCallbackReturnCodes.FAILURE was returned from defaultMsgCallback(). This caused the Reactor to shutdown.
loggerMsgEnd
期间备节点(连接到EDGESHA0185)数据更新并没有异常,所以我们紧急手动切换到备源取数。
之后,我们重启报错的主节点服务后行情可以正常更新。如果路孚特EMA服务端没有异常日志,那大概率是EMA API的异常
所以我们关注的问题是:
①这个报错是什么原因导致的? 从网络侧监控日志看,当时网络并无异常
②出现问题后,EMA API看起来并没有重连,链路也一直没有恢复,是API本身没有重连机制还是有其他问题?
③观察报错的内容,这种信息并不是通过OmmConsumerClient暴露的,无法被我们的程序检测,开发层面有什么办法能够捕获这些loggerMsg或者相关事件方,便我们后续监控?