微信公众号通过openid获取用户信息后插入数据库,报错:
Incorrect string value: ‘\xF0\x9F\x98\xAD",…’ for column ‘commentContent’ at row 1


原因:

微信名称带有Emoji表情😀😁😂😃😄😅😆😉😊😋…或者某些特殊字符▪▫◻◼◽◾⬛⬜…导致。.

这些特殊符号是4个字节,mysql的utf-8编码最多3个字节,导致插不进去。

MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,
专门用来兼容四字节的unicode。

解决办法:

  1. mysql对应字段的编码utf-8变成utf8mb4(不知道为什么有时不灵)
    在这里插入图片描述
    最好不要修改mysql原有配置!!!
    Java通过jdbc连接数据库url去掉characterEncoding=utf8,否则无效。

    //不指定编码格式时:Connection 中sesson的参数characterEncoding值与mysql端character_set_server值一致
    mysql.url=jdbc:mysql://localhost:3306/nic?useUnicode=true

    修正一下:

    1. 在mysql中执行:SET NAMES utf8mb4;本次与数据库的连接来临时有效!!!
      执行SET NAMES utf8mb4的效果等同于同时设定如下:
      SET character_set_client='utf8mb4';
      SET character_set_connection='utf8mb4';
      SET character_set_results='utf8mb4';
      
      信息输入路径:client→connection→server;
      信息输出路径:server→connection→results。
      “SET NAMES utf8mb4”作用只是临时的,MySQL重启后就恢复默认了
      
    2. 注意MySQL客户端和Navicat执行show variables like ‘character%’;结果可能不同,以MySQL客户端为准。
  2. Java中过滤掉表情符号

s.replaceAll("[\\ud800\\udc00-\\udbff\\udfff\\ud800-\\udfff]", "-")

参考

MYSQL中SET NAMES UTF8的作用和内涵
Java 解决Emoji表情过滤问题

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐