专业编程基础技术教程

网站首页 > 基础教程 正文

结合数据结构来看看Java的String类

ccvgpt 2024-07-26 00:15:53 基础教程 7 ℃

数据结构中定义字符串是由零个或多个字符组成的有限序列,有限,指出字符串的长度是一个有限的数值;所谓的序列,说明串的相邻字符之间具有前驱和后继的关系。字符串一般记为s="a1a2...an"(n>=0),其中s是字符串的名称,用双引号括起来的字符序列是串的值,注意引号不属于串的内容。字符ai可以由字母,数字或其他字符组成,i(1≤i≤n)就是该字符在串中的位置。

在Java语言中将字符串作为对象来处理,可以通过访问Java API帮助文档java.lang包下的String类来看看字符串的相关方法。

结合数据结构来看看Java的String类

欢迎工作一到五年的Java工程师朋友们加入Java程序员开发: 854393687

群内提供免费的Java架构学习资料(里面有高可用、高并发、高性能及分布式、Jvm性能调优、Spring源码,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多个知识点的架构资料)合理利用自己每一分每一秒的时间来学习提升自己,不要再用"没有时间“来掩饰自己思想上的懒惰!趁年轻,使劲拼,给未来的自己一个交代!


首先看看String继承的超类和实现的接口有哪些?


1.字符串的常用方法

1.1 常用的构造方法底层实现

//1.由字符串original复制得到新的字符串
public String(String original) {
 this.value = original.value;
 this.hash = original.hash;
}
//2.得到值等于value的字符串
public String(char[] value) {
 this.value = Arrays.copyOf(value, value.length);
}
//3.返回字符串从第i个位置起的前j个字符
public String(char[] value, int offset, int count) {
 //判断索引i是否合法
 if (offset < 0) {
 throw new StringIndexOutOfBoundsException(offset);
 }
 //判断计数值是否合法
 if (count <= 0) {
 if (count < 0) {
 throw new StringIndexOutOfBoundsException(count);
 }
 //如果计数值等于0,返回的是空字符
 if (offset <= value.length) {
 this.value = "".value;
 return;
 }
 }
 //索引值>字符串长度-计数值,抛异常
 if (offset > value.length - count) {
 throw new StringIndexOutOfBoundsException(offset + count);
 }
 //其余情况返回要求值
 this.value = Arrays.copyOfRange(value, offset, offset+count);
}


1.2 equals方法

String中的equals()方法用来判断字符串的内容是否相等。String类中的equals方法是对父类Object类中的equals方法的覆盖,先来看下Object类的equals方法怎么写的:

public boolean equals(Object obj) {
 return (this == obj);
}

这里的this哪个对象调用该方法,this就指代哪个对象。

String中的equals()方法底层源码:

public boolean equals(Object anObject) {
 //调用该方法的对象与比较的参数相等,则返回true
 if (this == anObject) {
 return true;
 }
 //instanceof 运算符是用来在运行时指出对象是否是特定类的一个实例
 if (anObject instanceof String) {
 String anotherString = (String)anObject;
 int n = value.length;
 //首先比较两个字符串实例长度是否相等
 if (n == anotherString.value.length) {
 char v1[] = value;
 char v2[] = anotherString.value;
 int i = 0;
 //比较两个字符串对应位置的字符是否相等
 while (n-- != 0) {
 if (v1[i] != v2[i])
 return false;
 i++;
 }
 return true;
 }
 }
 return false;
}


也就是说,使用equals()方法是用来比较两个字符串的内容是否相等,它通过以下方法实现:

  • 首先判断两个字符串实例是否是同一个对象,如果是,那么它们的内容相等,返回true;
  • 如果不是同一个对象,判断该对象是否是String类的实例,如果是,将该对象实例强转为String类,判断二者的长度是否相等;
  • 若满足长度相等,再一一比较两个字符串对应位置的字符是否相等;


提到equals方法,就得结合“==”操作符来看了。“==”操作符用来比较操作数的值之间的关系,对于基本数据类型,变量存储的是值本身,而对于引用数据类型,变量存储的是对象的地址,比较的是两个对象的内存地址是否相等。

String类代表字符串,Java程序中的所有字符串文字比如“abc”都被实现为此类的实例。字符串一经创建后,它的值是不可以改变的,也就是说“abc”不可以再变成“abcd”。这就要求我们使用String的时候应该注意:尽量不要做字符串频繁的拼接操作。因为字符串一旦创建不可改变,只要频繁拼接,就会在字符串常量池中创建大量的字符串对象,给垃圾回收带来问题。

为了提升字符串的访问效率,在程序中使用了缓冲技术,所有被双引号括起来的字符串都会在JVM运行时数据区的字符串常量池中新建一份,(字符串常量池存储在方法区中)。如果程序中用到“abc”,会先在字符串常量池中查找有没有该字符串,如果找到直接拿来用,找不到就在字符串常量池中新建一个"abc"。

如下的代码,判断两个字符串是否相等:

String A="a";
String B="a";
System.out.println(A==B); //true


前面提到过“==”是用来比较值相等。程序中第一次出现"a"时,先在字符串常量池中新建一个字符串"a"对象,A指向该对象,当程序中再次出现"a"时,会先在字符串常量池中查找,发现已经创建了"a",于是直接拿来用了,使用B指向,也就是A,B引用指向的是同一对象,所以打印输出true。

再来看看String中的构造方法:


这个方法是初始化新创建的String对象,使其表示与参数相同的字符序列,换句话说,新创建的字符串时参数字符串的副本。

看下面代码,判断是否相等:

String C=new String("a");
String D=new String("a");
System.out.println(C==D); //false


参数字符串“a”对象,创建之前先在字符串常量池中查找有没有该对象,没有则创建;然后构造方法String(String original)以"a"为参数,new出两个对象存在堆中,C和D引用分别指向这两个对象,很明显C和D引用指向的是两个不同的对象,即上面这两行代码创建了三个不同的对象,方法区中一个,堆中两个。

2.字符串的模式匹配

子串在主串中的定位操作称为串的模式匹配,串的模式匹配应该算串的重要操作之一。来看看朴素的模式匹配算法。

根据要求从主串的第i个位置开始遍历。子串从第0个位置开始,如果相应位置的字符相等,则主串子串各向后移动一位判断下一位字符,如果不等,主串回到匹配位置的下一位,子串从0位开始,循环遍历,直到找到子串,最后返回子串在主串中的索引。简单地说,就是对主串的每一个字符作为子串开头,与要匹配的字符串进行匹配,这种匹配方式称为朴素的模式匹配算法。实现代码如下:

package com.java.String;
/*
* 串的模式匹配
* */
public class IndexTest {
 public static void main(String[] args){
 int s=indexSearch("eateqweapple","app",8);
 System.out.println(s);
 }
 //朴素的模式匹配算法,返回子串T在主串S中第pos个字符之后的位置
 public static int indexSearch(String S,String T,int pos){
 //默认值规定为0
 int index=0;
 int Slen=S.length();
 int Tlen=T.length();
 //S位置下标
 int i=pos; 
 //T位置下标
 int j=0; 
 while((i<Slen)&&(j<Tlen)){
 char s=S.charAt(i);
 char t=T.charAt(j);
 if(s==t){
 //如果当前位置的相等,都各加1比较下一位置
 i=i+1;
 j=j+1;
 }else{
 //否则回到主串S匹配的下一位置,子串从头开始
 i=i+1;
 j=0;
 }
 if(j>Tlen-1){
 index=i-Tlen;
 }
 }
 return index;
 }
}


算法复杂度分析:

最好的情况,一开始就匹配成功,算法复杂度为O(1); 稍微差一些,每次匹配都是首字母不匹配,但遍历到主串的最后位置匹配成功,算法复杂度为O(n+m);最坏的情况,每次匹配不成功都是发生在子串的最后一个字符,时间复杂度为O((n-m+1)*m)。

朴素的模式匹配算法算很简单的解决子串定位问题的算法了。想一想Java底层那些封装好的方法,我们真是站在了巨人的肩膀上。

欢迎工作一到五年的Java工程师朋友们加入Java程序员开发: 854393687

群内提供免费的Java架构学习资料(里面有高可用、高并发、高性能及分布式、Jvm性能调优、Spring源码,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多个知识点的架构资料)合理利用自己每一分每一秒的时间来学习提升自己,不要再用"没有时间“来掩饰自己思想上的懒惰!趁年轻,使劲拼,给未来的自己一个交代!


Tags:

最近发表
标签列表