算法1-無重復(fù)字符的最長子串

無重復(fù)字符的最長子串

給定一個(gè)字符串,請你找出其中不含有重復(fù)字符的 最長子串 的長度。

示例 1:
輸入: "abcabcbb"
輸出: 3 
解釋: 因?yàn)闊o重復(fù)字符的最長子串是 "abc",所以其長度為 3。
示例 2:

輸入: "bbbbb"
輸出: 1
解釋: 因?yàn)闊o重復(fù)字符的最長子串是 "b",所以其長度為 1。
示例 3:

輸入: "pwwkew"
輸出: 3
解釋: 因?yàn)闊o重復(fù)字符的最長子串是 "wke",所以其長度為 3。
請注意,你的答案必須是 子串 的長度,"pwke" 是一個(gè)子序列,不是子串。

首先分析一下題目,求給定字符串的最長不重復(fù)子串,思路應(yīng)該是分治不斷降規(guī)模,把長度為n的字符串降為n-1的字符串的最長不重復(fù)子串,然后到n-2,.... 直到規(guī)模為1,關(guān)鍵在于如何得到遞推式。

以pwwkew為例做初步分析 ,定義a[i][j]為子串s[i,j]的最長不重復(fù)子串,容易得出以下結(jié)論:

a[0][0] = len(p) = 1;

a[0][1] = len(pw) = 2;

a[1][2] = len(ww) = 1;

a[i][i] = 1;

字符串s(i,j)包含s(i,j-1)并且只比s(i,j-1)多一個(gè)字符s[j],

定義a[i][j] = a[i][j-1] + f(j);

a[i][j] 要么和a[i][j-1]相等,要么比a[i][j-1]多1,

f(j)返回值只能是0或者1,什么時(shí)候是1,第一感覺是s(i,j-1)不含字符s(j)的時(shí)候。

不過這個(gè)感覺是錯(cuò)的,比如pwwk,a[0][2]= len(pww)=2; s(0,2)不含s(3)也就是字符k,a[0][3]= len(pwwk)為2 。

進(jìn)一步分析,f(j)= 1時(shí),要具備一個(gè)條件,也就是s[i,j-1]的最長子串出現(xiàn)的位置必須是緊挨j的位置,

比如pwwk, s(0,2)出現(xiàn)最長子串是pw,而不是ww,a[0][3] != a[0][2] + 1;

再比如pwwke, s(0,3)最長子串是pw或者wk,s(0,4)為wke, a[0][4] = a[0][3] + 1; 因?yàn)榫o挨s(4)也就是字符e的wk剛好也是s(0,3)的最長子串。

關(guān)于計(jì)算順序,先計(jì)算單個(gè)字符,然后2個(gè)字符,然后3個(gè)字符,.... n個(gè)字符的最長子串。

根據(jù)上面分析,code如下

class Solution {
    int[][] a;
    int n;

    public int lengthOfLongestSubstring(String s) {
        // a[i,j] 定義為s[i,j]的最長子串的長度
        // a[i,j] = a[i,j-1] + s[i,j-1].contain(s[j]) ? 0 :1,

        n = s.length();
        a = new int[n][n];
        for (int i = 0; i < n; i++) {
            a[i] = new int[n];
        }
        int max = 0;
        for (int i = 0; i < n; i++) {
            for (int j = 0; j < n - i; j++) {
                a[j][j + i] = maxLength(s, j, j + i);
                if(max < a[j][j + i]){
                    max = a[j][j + i];
                }
            }
        }
        return max;
    }

    public int maxLength(String s, int i, int j) {
        if (i == j)
            return 1;
        return  contain(s, i, j - 1, j) + a[i][j - 1];

    }

    int max(int a, int b) {
        return a > b ? a : b;
    }

    int contain(String s, int l, int h, int z) {
        char ch = s.charAt(z);
        int maxLen = a[l][h];
        if(a[h-maxLen+1][h] == maxLen){
            for (int i = h; i >= h - maxLen+1; i--) {
                if (s.charAt(i) == ch) {
                    return 0;
                }
            }
            return 1;
        }
        return 0;      
    }
}

滿心歡喜,折騰了半天終于完工了,拿來測試用例也都OK,平臺(tái)提交一下.....??超出內(nèi)存限制(98/100),通過了97個(gè)用例,第98是一個(gè)幾頁紙長的一個(gè)字符串。

代碼使用了n*n的int數(shù)組保存中間計(jì)算結(jié)果(n為字符串長度),當(dāng)n非常大的時(shí)候.....
好吧,想辦法減一點(diǎn)內(nèi)存消耗。

其實(shí)二維數(shù)組有將近一半沒有使用,真正用到的只有矩陣A[i,j]的(j>i部分)的半個(gè)矩陣

如pwwke的計(jì)算過程和結(jié)果如下,箭頭表示計(jì)算過程,從長到短。


pwwke的計(jì)算過程和結(jié)果

矩陣的左下全都沒用,這個(gè)應(yīng)該算是稀疏矩陣吧,大學(xué)時(shí)期學(xué)好像有聽過稀疏矩陣的壓縮存儲(chǔ),不管了,很遙遠(yuǎn)了,嘗試用一維數(shù)組來存儲(chǔ)這矩陣,數(shù)組的長度為 n + (n-1) + ... + 1 = n*(n+1)/2 ,比 n ^2還是省很多了。

接下來就是坐標(biāo)換算了, 二維的坐標(biāo)換到一維
(i,j )---> index

求index(i,j)的表達(dá)式。
對照上面的圖 (i為行數(shù),j為列數(shù))
index(i,j) = index(i,i) + j-i; // 先定位到第i行對角線位置,再偏移j-i
index(i, i)= n + (n-1) +...(n-i+1) = (2n-i+1) /2
index(i, j) = (2n-i+1) /2 + j-i

合并一下

index(i, j) =  i*(2n-1-i)/2 + j 

i = 0 時(shí)也滿足。

好了,修改代碼,把算法中的二維數(shù)組變成一維,修改后代碼如下

int[] a;
int n;
int twoN_1; // 2n-1

public int lengthOfLongestSubstring(String s) {
    // a[i,j] 定義為s[i,j]的最長子串的長度
    // a[i,j] = a[i,j-1] + s[i,j-1].contain(s[j]) ? 0 :1,

    n = s.length();
    twoN_1 = 2*n -1;
    a = new int[n*(n+1)/2];
 
    //    j ---->
    // i  00 01 02 03 04
    // |  10 11 12 13 14
    // !  20 21 22 23 24
    // !  30 31 32 33 34 
    //    40 41 42 43 44
    // a[b][c] --> a[index];
    // index = i*(2n-1-i)/2 + j
    int max = 0;
    int tmpIndex = 0;

    for (int i = 0; i < n; i++) {
        for (int j = 0; j < n - i; j++) {
            tmpIndex = index(j,j+i);
            a[tmpIndex] = maxLength(s, j, j + i);
            if(max < a[tmpIndex]){
                max = a[tmpIndex];
            }
        }
    }
    return max;
}

public int index(int i,int j){
    return i * (twoN_1 -i) /2 +j;
}

public int maxLength(String s, int i, int j) {
    if (i == j)
        return 1;
    return  contain(s, i, j - 1, j) + a[index(i,j-1)];

}

int max(int a, int b) {
    return a > b ? a : b;
}

int contain(String s, int l, int h, int z) {
    char ch = s.charAt(z);
    int maxLen = a[index(l,h)];
    if(a[index(h-maxLen+1,h)] == maxLen){
        for (int i = h; i >= h - maxLen+1; i--) {
            if (s.charAt(i) == ch) {
                return 0;
            }
        }
        return 1;
    }
    return 0;      
}

這下應(yīng)該行了吧,......... 生活總是殘酷的,很多時(shí)候,努力了也不一定會(huì)有好的結(jié)果,還是超出內(nèi)存限制。

看來得換另外的方式了,二維數(shù)組內(nèi)存消耗太大了,盡管改成了一維,但本質(zhì)上還是二維,那就來個(gè)真正的一維吧。

一頓分析猛如虎......

定義a[j]為 s(0,j)的最長子串, 真一維了,a[n-1] 為題目所求。

a[j] 與 a[j-1]的遞推式跟上面一致,關(guān)鍵也是s(0,j-1)的最長子串是以j-1結(jié)尾的

s(0,j-1) 的最長子串長度為 max,如果s(j-max, j-1)這段長度為max的子串是s(0,j-1)的最長子串,即s(j-max, j-1)沒有重復(fù)字符,而且如果s(j-max, j-1)不含字符s(j),則s(j-max, j) 是 s(0,j)的最長子串

那關(guān)鍵問題就是要判斷s(j-max, j-1) 這一小段有沒有重復(fù)了,s(j-max, j-1)有沒有包含字符s[j]了,這個(gè)好說,弄一個(gè)HashSet來協(xié)助判斷。

通過上面分析,形成新的代碼如下

int []a;// a[i] 標(biāo)示 s[0,i]的最大不重復(fù)子串長度
int n;
public int lengthOfLongestSubstring(String s) {
    n = s.length();
    a = new int[n];
    if(n == 0) return 0;
    a[0] = 1;
    for(int i=1;i<n;i++){
        a[i] = a[i-1] + fun(s,i);
    }
    return a[n-1];
}

HashSet<Character> hs = new HashSet();
// pwwk e  1 2 2 2
int fun(String s,int i){ // 返回0 || 1
    int h = i-1;
    int maxLen = a[h];
  
    char tmp;
    hs.clear();
    for(int j=h-maxLen+1 ;j<=h;j++){
        tmp = s.charAt(j);
        if(hs.contains(tmp))
           return 0;
        else hs.add(tmp);
    }

    return hs.contains(s.charAt(i)) ? 0 : 1;
}

這次提交通過了。

以上是筆者對這道理整個(gè)思考和解答過程,權(quán)且記錄。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容