百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

全网最全:Java字符串处理(java字符串处理方法)

wptr33 2025-07-28 00:36 1 浏览

Java字符串处理,包含了多个静态方法,用于执行不同类型的字符串操作。

开箱即用

空白和空字符串检查

  • isBlankIfStr(Object obj):检查对象是否为空白字符串,包括null、空字符串、只包含空白字符(如空格、制表符等)的字符串。
  • isEmptyIfStr(Object obj):检查对象是否为空字符串,与isBlankIfStr不同,此方法不检查空白字符。

字符串处理

  • trim(String[] strs):对字符串数组中的每个元素进行首尾空白字符去除。
  • utf8Str(Object obj)str(Object obj, Charset charset):将对象转换为UTF-8编码的字符串。
  • toString(Object obj)toStringOrNull(Object obj):调用对象的toString方法,toStringOrNull在对象为null时返回null

字符串创建

  • builder()strBuilder():分别创建StringBuilderStrBuilder对象。
  • builder(int capacity)strBuilder(int capacity):创建具有指定初始容量的StringBuilderStrBuilder对象。

字符串填充

  • fillBefore(String str, char filledChar, int len)fillAfter(String str, char filledChar, int len):在字符串前或后填充字符至指定长度。

字符串转换

  • getReader(CharSequence str)getWriter():分别获取StringReaderStringWriter对象。
  • reverse(String str):反转字符串。

字符串相似度

  • similar(String str1, String str2)similar(String str1, String str2, int scale):计算两个字符串的相似度。

UUID生成

  • uuid():生成随机UUID字符串。

文本格式化

  • format(CharSequence template, Map<?, ?> map)format(CharSequence template, Map<?, ?> map, boolean ignoreNull):使用占位符格式化文本。

字符串截断

  • truncateUtf8(String str, int maxBytes)truncateByByteLength(String str, Charset charset, int maxBytes, int factor, boolean appendDots):根据指定的最大字节长度截断字符串,并可选地添加省略号。

具体代码:(代码参考Hutool字符串处理类)

// ------------------------------------------------------------------------ Blank

/**
 * <p>如果对象是字符串是否为空白,空白的定义如下:</p>
 * <ol>
 *     <li>{@code null}</li>
 *     <li>空字符串:{@code ""}</li>
 *     <li>空格、全角空格、制表符、换行符,等不可见字符</li>
 * </ol>
 *
 * <p>例:</p>
 * <ul>
 *     <li>{@code StrUtil.isBlankIfStr(null)     // true}</li>
 *     <li>{@code StrUtil.isBlankIfStr("")       // true}</li>
 *     <li>{@code StrUtil.isBlankIfStr(" \t\n")  // true}</li>
 *     <li>{@code StrUtil.isBlankIfStr("abc")    // false}</li>
 * </ul>
 *
 * <p>注意:该方法与 {@link #isEmptyIfStr(Object)} 的区别是:
 * 该方法会校验空白字符,且性能相对于 {@link #isEmptyIfStr(Object)} 略慢。</p>
 *
 * @param obj 对象
 * @return 如果为字符串是否为空串
 * @see StrUtil#isBlank(CharSequence)
 * @since 3.3.0
 */
public static boolean isBlankIfStr(Object obj) {
    if (null == obj) {
       return true;
    } else if (obj instanceof CharSequence) {
       return isBlank((CharSequence) obj);
    }
    return false;
}
// ------------------------------------------------------------------------ Empty

/**
 * <p>如果对象是字符串是否为空串,空的定义如下:</p><br>
 * <ol>
 *     <li>{@code null}</li>
 *     <li>空字符串:{@code ""}</li>
 * </ol>
 *
 * <p>例:</p>
 * <ul>
 *     <li>{@code StrUtil.isEmptyIfStr(null)     // true}</li>
 *     <li>{@code StrUtil.isEmptyIfStr("")       // true}</li>
 *     <li>{@code StrUtil.isEmptyIfStr(" \t\n")  // false}</li>
 *     <li>{@code StrUtil.isEmptyIfStr("abc")    // false}</li>
 * </ul>
 *
 * <p>注意:该方法与 {@link #isBlankIfStr(Object)} 的区别是:该方法不校验空白字符。</p>
 *
 * @param obj 对象
 * @return 如果为字符串是否为空串
 * @since 3.3.0
 */
public static boolean isEmptyIfStr(Object obj) {
    if (null == obj) {
       return true;
    } else if (obj instanceof CharSequence) {
       return 0 == ((CharSequence) obj).length();
    }
    return false;
}

// ------------------------------------------------------------------------ Trim

/**
 * 给定字符串数组全部做去首尾空格
 *
 * @param strs 字符串数组
 */
public static void trim(String[] strs) {
    if (null == strs) {
       return;
    }
    String str;
    for (int i = 0; i < strs.length; i++) {
       str = strs[i];
       if (null != str) {
          strs[i] = trim(str);
       }
    }
}

/**
 * 将对象转为字符串<br>
 *
 * <pre>
 * 1、Byte数组和ByteBuffer会被转换为对应字符串的数组
 * 2、对象数组会调用Arrays.toString方法
 * </pre>
 *
 * @param obj 对象
 * @return 字符串
 */
public static String utf8Str(Object obj) {
    return str(obj, CharsetUtil.CHARSET_UTF_8);
}

/**
 * 将对象转为字符串
 *
 * <pre>
 * 1、Byte数组和ByteBuffer会被转换为对应字符串的数组
 * 2、对象数组会调用Arrays.toString方法
 * </pre>
 *
 * @param obj         对象
 * @param charsetName 字符集
 * @return 字符串
 * @deprecated 请使用 {@link #str(Object, Charset)}
 */
@Deprecated
public static String str(Object obj, String charsetName) {
    return str(obj, Charset.forName(charsetName));
}

/**
 * 将对象转为字符串
 * <pre>
 *   1、Byte数组和ByteBuffer会被转换为对应字符串的数组
 *   2、对象数组会调用Arrays.toString方法
 * </pre>
 *
 * @param obj     对象
 * @param charset 字符集
 * @return 字符串
 */
public static String str(Object obj, Charset charset) {
    if (null == obj) {
       return null;
    }

    if (obj instanceof String) {
       return (String) obj;
    } else if (obj instanceof byte[]) {
       return str((byte[]) obj, charset);
    } else if (obj instanceof Byte[]) {
       return str((Byte[]) obj, charset);
    } else if (obj instanceof ByteBuffer) {
       return str((ByteBuffer) obj, charset);
    } else if (ArrayUtil.isArray(obj)) {
       return ArrayUtil.toString(obj);
    }

    return obj.toString();
}

/**
 * 将byte数组转为字符串
 *
 * @param bytes   byte数组
 * @param charset 字符集
 * @return 字符串
 */
public static String str(byte[] bytes, String charset) {
    return str(bytes, CharsetUtil.charset(charset));
}

/**
 * 解码字节码
 *
 * @param data    字符串
 * @param charset 字符集,如果此字段为空,则解码的结果取决于平台
 * @return 解码后的字符串
 */
public static String str(byte[] data, Charset charset) {
    if (data == null) {
       return null;
    }

    if (null == charset) {
       return new String(data);
    }
    return new String(data, charset);
}

/**
 * 将Byte数组转为字符串
 *
 * @param bytes   byte数组
 * @param charset 字符集
 * @return 字符串
 */
public static String str(Byte[] bytes, String charset) {
    return str(bytes, CharsetUtil.charset(charset));
}

/**
 * 解码字节码
 *
 * @param data    字符串
 * @param charset 字符集,如果此字段为空,则解码的结果取决于平台
 * @return 解码后的字符串
 */
public static String str(Byte[] data, Charset charset) {
    if (data == null) {
       return null;
    }

    byte[] bytes = new byte[data.length];
    Byte dataByte;
    for (int i = 0; i < data.length; i++) {
       dataByte = data[i];
       bytes[i] = (null == dataByte) ? -1 : dataByte;
    }

    return str(bytes, charset);
}

/**
 * 将编码的byteBuffer数据转换为字符串
 *
 * @param data    数据
 * @param charset 字符集,如果为空使用当前系统字符集
 * @return 字符串
 */
public static String str(ByteBuffer data, String charset) {
    if (data == null) {
       return null;
    }

    return str(data, CharsetUtil.charset(charset));
}

/**
 * 将编码的byteBuffer数据转换为字符串
 *
 * @param data    数据
 * @param charset 字符集,如果为空使用当前系统字符集
 * @return 字符串
 */
public static String str(ByteBuffer data, Charset charset) {
    if (null == charset) {
       charset = Charset.defaultCharset();
    }
    return charset.decode(data).toString();
}

/**
 * 调用对象的toString方法,null会返回“null”
 *
 * @param obj 对象
 * @return 字符串
 * @see String#valueOf(Object)
 * @since 4.1.3
 */
public static String toString(Object obj) {
    return String.valueOf(obj);
}

/**
 * 调用对象的toString方法,null会返回{@code null}
 *
 * @param obj 对象
 * @return 字符串 or {@code null}
 * @since 5.7.17
 */
public static String toStringOrNull(Object obj) {
    return null == obj ? null : obj.toString();
}

/**
 * 创建StringBuilder对象
 *
 * @return StringBuilder对象
 */
public static StringBuilder builder() {
    return new StringBuilder();
}

/**
 * 创建StrBuilder对象
 *
 * @return StrBuilder对象
 * @since 4.0.1
 */
public static StrBuilder strBuilder() {
    return StrBuilder.create();
}

/**
 * 创建StringBuilder对象
 *
 * @param capacity 初始大小
 * @return StringBuilder对象
 */
public static StringBuilder builder(int capacity) {
    return new StringBuilder(capacity);
}

/**
 * 创建StrBuilder对象
 *
 * @param capacity 初始大小
 * @return StrBuilder对象
 * @since 4.0.1
 */
public static StrBuilder strBuilder(int capacity) {
    return StrBuilder.create(capacity);
}

/**
 * 获得StringReader
 *
 * @param str 字符串
 * @return StringReader
 */
public static StringReader getReader(CharSequence str) {
    if (null == str) {
       return null;
    }
    return new StringReader(str.toString());
}

/**
 * 获得StringWriter
 *
 * @return StringWriter
 */
public static StringWriter getWriter() {
    return new StringWriter();
}

/**
 * 反转字符串<br>
 * 例如:abcd =》dcba
 *
 * @param str 被反转的字符串
 * @return 反转后的字符串
 * @since 3.0.9
 */
public static String reverse(String str) {
    return new String(ArrayUtil.reverse(str.toCharArray()));
}

// ------------------------------------------------------------------------ fill

/**
 * 将已有字符串填充为规定长度,如果已有字符串超过这个长度则返回这个字符串<br>
 * 字符填充于字符串前
 *
 * @param str        被填充的字符串
 * @param filledChar 填充的字符
 * @param len        填充长度
 * @return 填充后的字符串
 * @since 3.1.2
 */
public static String fillBefore(String str, char filledChar, int len) {
    return fill(str, filledChar, len, true);
}

/**
 * 将已有字符串填充为规定长度,如果已有字符串超过这个长度则返回这个字符串<br>
 * 字符填充于字符串后
 *
 * @param str        被填充的字符串
 * @param filledChar 填充的字符
 * @param len        填充长度
 * @return 填充后的字符串
 * @since 3.1.2
 */
public static String fillAfter(String str, char filledChar, int len) {
    return fill(str, filledChar, len, false);
}

/**
 * 将已有字符串填充为规定长度,如果已有字符串超过这个长度则返回这个字符串
 *
 * @param str        被填充的字符串
 * @param filledChar 填充的字符
 * @param len        填充长度
 * @param isPre      是否填充在前
 * @return 填充后的字符串
 * @since 3.1.2
 */
public static String fill(String str, char filledChar, int len, boolean isPre) {
    final int strLen = str.length();
    if (strLen > len) {
       return str;
    }

    String filledStr = StrUtil.repeat(filledChar, len - strLen);
    return isPre ? filledStr.concat(str) : str.concat(filledStr);
}

/**
 * 计算两个字符串的相似度
 *
 * @param str1 字符串1
 * @param str2 字符串2
 * @return 相似度
 * @since 3.2.3
 */
public static double similar(String str1, String str2) {
    return TextSimilarity.similar(str1, str2);
}

/**
 * 计算两个字符串的相似度百分比
 *
 * @param str1  字符串1
 * @param str2  字符串2
 * @param scale 相似度
 * @return 相似度百分比
 * @since 3.2.3
 */
public static String similar(String str1, String str2, int scale) {
    return TextSimilarity.similar(str1, str2, scale);
}

/**
 * 生成随机UUID
 *
 * @return UUID字符串
 * @see IdUtil#randomUUID()
 * @since 4.0.10
 */
public static String uuid() {
    return IdUtil.randomUUID();
}

/**
 * 格式化文本,使用 {varName} 占位<br>
 * map = {a: "aValue", b: "bValue"} format("{a} and {b}", map) ---=》 aValue and bValue
 *
 * @param template 文本模板,被替换的部分用 {key} 表示
 * @param map      参数值对
 * @return 格式化后的文本
 */
public static String format(CharSequence template, Map<?, ?> map) {
    return format(template, map, true);
}

/**
 * 格式化文本,使用 {varName} 占位<br>
 * map = {a: "aValue", b: "bValue"} format("{a} and {b}", map) ---=》 aValue and bValue
 *
 * @param template   文本模板,被替换的部分用 {key} 表示
 * @param map        参数值对
 * @param ignoreNull 是否忽略 {@code null} 值,忽略则 {@code null} 值对应的变量不被替换,否则替换为""
 * @return 格式化后的文本
 * @since 5.4.3
 */
public static String format(CharSequence template, Map<?, ?> map, boolean ignoreNull) {
    return StrFormatter.format(template, map, ignoreNull);
}

/**
 * 截断字符串,使用其按照UTF-8编码为字节后不超过maxBytes长度。截断后自动追加省略号(...)
 * 用于存储数据库varchar且编码为UTF-8的字段
 *
 * @param str      java字符串
 * @param maxBytes 最大字节长度
 * @return 截断后的字符
 */
public static String truncateUtf8(String str, int maxBytes) {
    Charset charset = StandardCharsets.UTF_8;
    //UTF-8编码单个字符最大长度4
    return truncateByByteLength(str, charset, maxBytes, 4, true);
}

/**
 * 截断字符串,使用其按照指定编码为字节后不超过maxBytes长度<br>
 * 此方法用于截取总bytes数不超过指定长度,如果字符出没有超出原样输出,如果超出了,则截取掉超出部分,并可选添加...,
 * 但是添加“...”后总长度也不超过限制长度。
 *
 * @param str        原始字符串
 * @param charset    指定编码
 * @param maxBytes   最大字节数
 * @param factor     速算因子,取该编码下单个字符的最大可能字节数
 * @param appendDots 截断后是否追加省略号(...)
 * @return 截断后的字符串
 */
public static String truncateByByteLength(String str, Charset charset, int maxBytes, int factor,
       boolean appendDots) {
    //字符数*速算因子<=最大字节数
    if (str == null || str.length() * factor <= maxBytes) {
       return str;
    }
    final byte[] sba = str.getBytes(charset);
    if (sba.length <= maxBytes) {
       return str;
    }
    //限制字节数
    final int limitBytes;
    if (appendDots) {
       limitBytes = maxBytes - "...".getBytes(charset).length;
    } else {
       limitBytes = maxBytes;
    }
    final ByteBuffer bb = ByteBuffer.wrap(sba, 0, limitBytes);
    final CharBuffer cb = CharBuffer.allocate(limitBytes);
    final CharsetDecoder decoder = charset.newDecoder();
    //忽略被截断的字符
    decoder.onMalformedInput(CodingErrorAction.IGNORE);
    decoder.decode(bb, cb, true);
    decoder.flush(cb);
    final String result = new String(cb.array(), 0, cb.position());
    if (appendDots) {
       return result + "...";
    }
    return result;
}

相关推荐

HIVE 窗口函数详解(hive常用开窗函数)

什么是窗口函数窗口函数是SQL中一类特别的函数。和聚合函数相似,窗口函数的输入也是多行记录。不同的是,聚合函数的作用于由GROUPBY子句聚合的组,而窗口函数则作用于一个窗口,这里,窗口...

SQL高效使用20招:数据分析师必备技巧

基础优化技巧善用EXPLAIN分析执行计划EXPLAINSELECT*FROMordersWHEREorder_date>'2024-01-01';...

答记者问之 - Redis 的高效架构与应用模式解析

问:极客程序员你好,请帮我讲一讲redis答:redis主要涉及以下核心,我来一一揭幕Redis的高效架构与应用模式解析...

MySQL通过累计求新增(mysql新增表字段语句)

前两天的那篇内容《MySQL递归实现单列分列成多行》...

一文讲懂SQL窗口函数 大厂必考知识点

大家好,我是宁一。今天是我们的第24课:窗口函数。...

圣诞快乐:用GaussDB T 绘制一颗圣诞树,兼论高斯数据库语法兼容

转眼就是圣诞的节日,祝大家节日快乐。用GaussDBT(也就是GaussDB100)绘制一棵圣诞树,纯国产,更喜庆。话不多说,上图:SQL如下:SELECTCASEWHENENMOTE...

Minitab:功能强大的质量管理、统计分析及统计图形软件

一、Minitab简介Minitab软件是为质量改善、教育和研究应用领域提供统计软件和服务的先导,是全球领先的质量管理和六西格玛实施软件工具及持续质量改进的良好工具软件,她具有强大的功能和简易的可视化...

如何熟练使用SQL查询(如何熟练使用sql查询内容)

要熟练使用SQL查询(StructuredQueryLanguage),你需要系统地从语法入门,到实战练习,再到性能优化与多表查询的掌握。下面是一条循序渐进、实战驱动的学习路径:第一阶段:S...

SAP SE38如何在多个系统间同步代码

上一篇文章写了如何在多个系统之间同步开发对象:多套SAPERP之间一键同步ABAP开发内容,有兄弟问有没有简单办法同步SE38程序代码的,因为使用请求的方式同步代码有点小题大做了。...

Python | 垂直模态分解(phython垂直输出)

...

技术栈:刷了百道SQL题,还是不会用?你应该这样补短板

这是来自用户的提问,也是很多人遇到的困惑:...

mysql窗口函数为了解决更加复杂的问题

为了解决复杂问题的窗口函数我们先讲一下窗口函数是什么窗口和普通的函数作用相同在不同列上进行查询和返回比如我们有如下的表...

MariaDB开窗函数(开窗函数 mysql)

在使用GROUPBY子句时,总是需要将筛选的所有数据进行分组操作,它的分组作用域是整张表。分组以后,为每个组只返回一行。而使用基于窗口的操作,类似于分组,但却可以对这些"组"(即窗口...

一文掌握 DuckDB 时间序列分析:窗口函数实战详解

...

一篇文章搞定MySQL中的窗口函数(mysql常用的窗口函数)

我是孙斌,北理数学系毕业,分享数据分析相关知识,点击右上角“关注”,学习更多数据分析知识。在MySQL中,分组groupby一般和聚合函数连用,如groupby+sum,这样能够得到每个组的总和,...