博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Dubbo分布式服务框架常见问题解答汇总
阅读量:6440 次
发布时间:2019-06-23

本文共 8855 字,大约阅读时间需要 29 分钟。

hot3.png

1. 如果服务注册不上怎么办?

(1) 检查dubbo的jar包有没有在classpath中,以及有没有重复的jar包

(2) 检查有没有重复的dubbo.properties配置文件
(3) 检查暴露服务的spring配置有没有加载
(4) 检查beanId或beanName有没有重复
(5) 查看有没有错误日志:
cat ~/output/logs/webx.log
(6) 在服务提供者机器上测试与注册中心的网络是否通:
telnet 172.22.3.94 9090
(7) 检查与注册中心的连接是否存在:
netstat -anp | grep 172.22.3.94
(8) 如果是预发布机,检查hosts文件有没有正确绑定:
cat /etc/hosts
(9) 实在不行,开启远程调试:
– (a) 在服务器JVM参数中加入:-Xdebug -Xnoagent -Djava.compiler=NONE -Xrunjdwp:transport=dt_socket,address=7001,server=y,suspend=y
注意线上只有7001和8080可以被线下访问,调试端口需用这两个之一,因注册是启动时行为,启动时必需挂起suspend=y
– (b) 在dubbo源码的DefaultRegistryService的registerService()方法中设置断点。
– (c) 在Eclipse的Debug按钮下拉菜单Debug Configurations中的Remote Java Applications中新增远程调试,并设置IP和端口,以及增加dubbo的源码,进行远程Debug调试。

 

2. 出现RpcException: No provider available for remote service异常怎么办?

表示没有可用的服务提供者,

1). 检查连接的注册中心是否正确
2). 到注册中心查看相应的服务提供者是否存在
3). 检查服务提供者是否正常运行

 

3. 出现调用超时com.alibaba.dubbo.remoting.TimeoutException异常怎么办?

通常是业务处理太慢,可在服务提供方执行:jstack PID > jstack.log 分析线程都卡在哪个方法调用上,这里就是慢的原因。

如果不能调优性能,请将timeout设大。

 

4. 出现hessian序列化失败com.caucho.hessian.client.HessianRuntimeException怎么办?

1). 检查服务方法的传入传出参数是否实现Serializable接口

2). 检查服务方法的传入传出参数是否继承了Number,Date,ArrayList,HashMap等hessian特殊化处理的类

 

5. 出现Configuration problem: Unable to locate Spring NamespaceHandler for XML schema namespace [http://repo.alibaba-inc.com/schema/dubbo]怎么办?

表示spring找不到<dubbo:...>配置的解析处理器。

通常是Dubbo的jar没有引入,请加入对Dubbo的依赖,或者是ClassLoader隔离,看是否有使用osgi或其它热加载机制。

 

6. 出现"消息发送失败"异常怎么办?

通常是接口方法的传入传出参数未实现Serializable接口。

 

7. 出现org.xml.sax.SAXParseException: cvc-elt.1: Cannot find the declaration of element 'beans'异常怎么办?

 

表示xsd加载失败,

1). 检查spring版本,如果是spring2.0版本,因为该版本不能读取jar包内xsd,会读取外网的xsd,而线上环境通常不允许访问外网,
可修改/etc/hosts加入:(已将spring的xsd放在公司内部的maven仓库中)
10.20.133.138  repo.alibaba-inc.com  www.springframework.org
spring2.5.x版本不存在此问题,可以考虑升级到2.5.x版本。
2). 检查有没有使用osgi的xsd,如果用了,需要将spring-osgi.jar及其依赖包加进来

 

8. 项目依赖的三方库与Dubbo所依赖的版本冲突怎么办。

比如,项目使用的spring和commons.pool与dubbo冲突,

dubbo使用的是spring2.5和commons.pool1.4,
而项目中其它模块依赖的是spring2.0.1和commons.pool1.3。

1). 在Maven中,使用项目根pom.xml中的dependencyManagement版本仲裁解决:

com.alibaba.external
sourceforge.spring
2.0.1
com.alibaba.external
jakarta.commons.poolg
1.3

 

9. 出现java.util.concurrent.RejectedExecutionException或者Thread pool exhausted怎么办?

RejectedExecutionException表示线程池已经达到最大值,并且没有空闲连,拒绝执行了一些任务。

Thread pool exhausted通常是min和max不一样大时,表示当前已创建的连接用完,进行了一次扩充,创建了新线程,但不影响运行。
原因可能是连接池不够用,请调整dubbo.properites中的:

// 设成一样大,减少线程池收缩开销dubbo.service.min.thread.pool.size=200dubbo.service.max.thread.pool.size=200

配置项说明请参见:配置参考手册

如果线程池已经有200,还不够,通常是业务处理占用线程时间过长,
需优化业务,可通过运行:
jstack 进程号 > jstack.txt
分析当前大多数线程都在干什么,从而分析出哪个地方是瓶颈,
比如,如果大部分线程都在处理SQL,可能是数据库连接不够,或数据源配置错误,或SQL没走索引等。

 

10. 出现com.alibaba.dubbo.registry.internal.rpc.exception.RpcLocalExceptionIoTargetIsNotConnected怎么办?

1). 检查注册中心是否开启白名单功能,如果开启,当IP不在白名单列表中,注册中心将拒绝连接。

2). 检查端口是否正确,注册中心有两个端口,一个为控制台HTTP端口,用于管理员查看数据,一个为程序注册服务用的TCP端口。

 

11. 出现Remote server returns error: [6], Got invocation exception怎么办?

此异常表示Dubbo框架调用服务提供者的实现方法失败,并且不是方法本身的业务异常。通常是服务消费者和服务提供者的API签名不一致引起,或者提供方比消费方少此函数。一般是服务增加方法,或修改了方法签名,而双方用的服务API的jar包不一致。

 

12. 出现Error closing connection/tbr-client java.lang.NullPointerException怎么办?

如果服务提供者先关闭,当注册中心通知服务消费者后,服务消费者会再次关闭与服务提供者的连接,而此时连接早已不存在,TBRemoting没有判断null,直接调用了close方法,所以会抛出空指针异常,由于TBRemoting源码由taobao管理,暂时未解决此BUG,但不影响使用,可忽略。Dubbo1.0.11-3以后版本已hack了taobao的代码,不存在此问题。

 

13. 出现org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'xxxService': Initialization of bean failed; nested exception is java.lang.IllegalArgumentException: Method must not be null怎么办?

通常是classpath下存在spring多个版本的jar包,排除掉不需要的spring包即可。

 

14. 出现Error setting property values; nested exception is org.springframework.beans.NotWritablePropertyException: Invalid property 'applicationName' of bean class [com.alibaba.dubbo.registry.internal.DefaultRegistryService]: Bean property 'applicationName' is not writable or has an invalid setter method.怎么办?

出现类似的dubbo某个类的属性没有setter方法的异常,通常是classpath下有多个不同版本的dubbo的jar包,导致配置文件与类不匹配。可以在程序中运行下面的代码发现重复的类或jar包:(代码中的类名视具体冲突而定)

Enumeration
urls = Thread.currentThread().getContextClassLoader().getResources("com/alibaba/dubbo/registry/internal/DefaultRegistryService.class");while (urls.hasMoreElements()) { URL url = urls.nextElement(); System.out.println(">>>>>>>>>>>>>>>>>>>>>>" + url.getFile());}

 

15. 服务提供者没挂,但在注册中心里看不到怎么办?

首先,确认服务提供者是否连接了正确的注册中心,不只是检查配置中的注册中心地址,而且要检查实际的网络连接。

其次,看服务提供者是否非常繁忙,比如压力测试,以至于没有CPU片段向注册中心发送心跳,这种情况,减小压力,将自动恢复。

 

16. 出现ERROR monitor.StatLog -拒绝连接 java.net.ConnectException:拒绝连接 com.alibaba.dubbo.monitor.StatLog.sendStatData怎么办?

监控中心不可用,发送统计信息失败,不影响调用,但将丢失统计信息。

 

17. 服务地址出现127.0.0.1怎么办?

Dubbo1.0.7以后版本不存在此问题,当发现本机IP为127.0.0.1时,将遍历所有网卡查找有效IP。

之前版本处理方式:
正确配置的IP映射,Linux下为/etc/hosts,Windows下为C:/WINDOWS/system32/drivers/etc/hosts
假设:ifconfig命令行结果为10.20.130.230,hostname命令行结果为test2,
则配置为:

127.0.0.1 localhost  10.20.130.230 test2

 

18. 通过netstat -anp看到连接的注册中心和配置的不一样怎么办?

检查classpath下是否存在两个dubbo.properties文件:

Enumeration
urls = Thread.currentThread().getContextClassLoader().getResources("dubbo.properties");while (urls.hasMoreElements()) { URL url = urls.nextElement(); System.out.println(">>>>>>>>>>>>>>>>>>>>>>" + url.getFile());}

 

19. 客户端的异常信息里的errorcode是什么意思?

如Remote server returns error: [6], Got invocation exception

1 — 收到消息的时候线程池拒绝处理
2 — 服务提供者端未能根据服务名找到相应服务
3 — 该服务调用时,服务提供者端不能加载参数类型对应的class
4 — 参数不能被正确的反序列化
5 — 不能正确从Class中create该调用所指示的方法
6 — 不能正确调用该方法

 

20. 出现expected string at 0×33 java.lang.String 怎么办?

这是Hessian3.2.1的一个BUG,Dubbo内部使用Hessian3.2.1做序列化,升级到Dubbo1.0.14以上版本,已解决此问题。

具体原因参见:
http://pt.alibaba-inc.com/wp/experience_929/hessian-big-string-serialize-problems.html

 

21. 预发布环境,在本地的/etc/hosts文件作了对注册中心的绑定,为什么服务还是注册到生产环境的注册中心?

antx.properties中配置的 dubbo.registry.address = dubbo-reg1.hst.xyi.cn.alidc.net dubbo-reg2.hst.xyi.cn.alidc.net dubbo-reg3.hst.xyi.cn.alidc.net dubbo-reg4.hst.xyi.cn.alidc.net

而/etc/hosts里的绑定如下:
172.22.14.13 dubbo-reg1.hst.xyi.cn.alidc.net dubbo-reg2.hst.xyi.cn.alidc.net
两边的不一致,导致该问题出现。
将绑定修改为:172.22.14.13 dubbo-reg1.hst.xyi.cn.alidc.net dubbo-reg2.hst.xyi.cn.alidc.net dubbo-reg3.hst.xyi.cn.alidc.net dubbo-reg4.hst.xyi.cn.alidc.net 即可!

 

22. 注册中心上服务是存在的,为什么报找不到服务的错误?
Caused by: com.alibaba.dubbo.rpc.RpcException: No invoker available for remote service com.alibaba.china.album.service.IBankNewPicService:1.0.0, servers: []

注册中心上看到的服务提供者提供的服务地址是:dubbo://172.29.61.76:55372?version=1.0.0&group=ibank&dubbo=1.0.0&application=ibank

原因:服务提供者配置了group属性,默认的路由规则是 服务名= group/serviceName。
这个服务,根据默认的路由规则,消费者消费的服务名应该是 ibank/com.alibaba.china.album.service.IBankNewPicService:1.0.0

 

23. 获取版本号出现java.lang.NullPointerException怎么办?

java.lang.NullPointerException

at com.alibaba.dubbo.classic.DubboVersion.getVersion
这个只有1.0.14和1.0.14-2存在的问题,在获取版本时静态字段初始化顺序不对,不影使用,可忽略,升级为1.0.15以上版本不再会有该问题。

 

24. 以及配置中如何使用占位符?

注:此为Spring的标准功能,仅在此提示使用方式,不属于Dubbo范畴。

使用Spring自带的PropertyPlaceholderConfigurer实现properties配置:

xxx=10.20.130.230:9090yyy=morgan

 

25. 使用多个进程启动服务,端口冲突怎么办?

注:此为Spring的标准功能,仅在此提示使用方式,不属于Dubbo范畴。

使用Spring自带的PropertyPlaceholderConfigurer的SYSTEM_PROPERTIES_MODE_OVERRIDE实现通过-D参数设置端口:
java -Ddubbo.service.server.port=20881

 

26. 如何加载Spring?

注:此为Spring的标准功能,仅在此提示使用方式,不属于Dubbo范畴。

1). 基于ClassPath加载:

ClassPathXmlApplicationContext context = new ClassPathXmlApplicationContext(new String[}{"http://10.20.160.198/wiki/display/dubbo/service.xml"});context.start();

2). 基于文件系统加载:

FileSystemXmlApplicationContext context = new FileSystemXmlApplicationContext(new String[}{"http://10.20.160.198/home/xxx/service.xml"});context.start();

3). 基于Web容器加载:(WEB-INF/web.xml)

contextConfigLocation
classpath:service.xml
org.springframework.web.context.ContextLoaderListener

 

27. 出现org.xml.sax.SAXParseException: cvc-complex-type.2.4.c: The matching wildcard is strict, but no declaration can be found for element怎么办?

通常是在用Dubbo1.0的jar包,却用了Dubbo2.0才支持的<dubbo:registry> <dubbo:application> <dubbo:provider> <dubbo:consumer>或2.0才支持的属性。

 

28. 出现Could not deserialize parameter instance, error is: readObject: unexpected end of file怎么办?

通常是消费方或提供方的内存不足,导致buffer不能分配,使发送到一半的请求被中断了。

也可能是网络抖动,导致传输流被中断。

 

29. 出现java.net.SocketException: Invalid argument: sun.nio.ch.Net.setIntOption怎么办?

通常是Windows Vista和Windows7的JDK1.6的部分版本存在BUG:

https://issues.apache.org/jira/browse/DIRMINA-379
可以换换JDK版本试试。

 

转自:

转载于:https://my.oschina.net/lenglingx/blog/1590356

你可能感兴趣的文章
Apache Commons工具集简介
查看>>
【翻译】Nginx的反向代理
查看>>
htm、html、shtml网页区别
查看>>
SpringCloud学习笔记:服务注册与发现Eureka(2)
查看>>
学习新 api 的思考过程 4.18
查看>>
想要设计自己的微服务?看这篇文章就对了
查看>>
[译] 原生 JavaScript 值得学习吗?答案是肯定的
查看>>
29岁了还一事无成是人生的常态?
查看>>
gRPC-rs:从 C 到 Rust
查看>>
Mysql-高性能索引
查看>>
chrome浏览器最小字号解决方案
查看>>
富文本编译器UEditor+SSM的使用
查看>>
Java EE之旅02 CSS基础
查看>>
kubernetes学习笔记 (二):k8s初体验
查看>>
swift3 0 流控制
查看>>
Data-Mediator专题之属性回调
查看>>
每天一个Linux命令之ps-查看系统进程信息
查看>>
图解JavaScript原型链继承
查看>>
用VIPER构建iOS应用
查看>>
Java开源诊断工具 Arthas 发布v3.1.0
查看>>