Context Navigation

← Previous Changeset
Next Changeset →

Changeset 21704 in webkit

Timestamp:

May 24, 2007 1:56:35 AM (17 years ago)

Author:

hyatt

Message:

Rework how HTML handles line numbering so that it is not fooled by
\r without a following \n and so that document.write doesn't lead
to line numbering confusion.

Reviewed by aroben

html/HTMLParser.cpp: (WebCore::HTMLParser::reportErrorToConsole):
html/HTMLTokenizer.cpp: (WebCore::HTMLTokenizer::processListing): (WebCore::HTMLTokenizer::parseSpecial): (WebCore::HTMLTokenizer::parseComment): (WebCore::HTMLTokenizer::parseServer): (WebCore::HTMLTokenizer::parseProcessingInstruction): (WebCore::HTMLTokenizer::parseText): (WebCore::HTMLTokenizer::parseEntity): (WebCore::HTMLTokenizer::parseTag): (WebCore::HTMLTokenizer::write): (WebCore::HTMLTokenizer::processToken): (WebCore::HTMLTokenizer::setSrc):
html/HTMLTokenizer.h: (WebCore::HTMLTokenizer::lineNumberPtr):
html/HTMLViewSourceDocument.cpp: (WebCore::HTMLViewSourceDocument::addLine):
loader/TextDocument.cpp: (WebCore::TextTokenizer::write):
platform/SegmentedString.cpp: (WebCore::SegmentedString::SegmentedString): (WebCore::SegmentedString::operator=): (WebCore::SegmentedString::clear):
platform/SegmentedString.h: (WebCore::SegmentedString::SegmentedString): (WebCore::SegmentedString::advance): (WebCore::SegmentedString::escaped):

Location:

trunk/WebCore

Files:

: 8 edited

ChangeLog (modified) (1 diff)
html/HTMLParser.cpp (modified) (1 diff)
html/HTMLTokenizer.cpp (modified) (41 diffs)
html/HTMLTokenizer.h (modified) (1 diff)
html/HTMLViewSourceDocument.cpp (modified) (1 diff)
loader/TextDocument.cpp (modified) (1 diff)
platform/SegmentedString.cpp (modified) (3 diffs)
platform/SegmentedString.h (modified) (4 diffs)

Legend:

: Unmodified
: Added
: Removed

trunk/WebCore/ChangeLog

-                      r21698
+                      r21704
+-05-24  David Hyatt  <hyatt@apple.com>
+        Rework how HTML handles line numbering so that it is not fooled by
+        \r without a following \n and so that document.write doesn't lead
+        to line numbering confusion.
+        Reviewed by aroben
+        * html/HTMLParser.cpp:
+        (WebCore::HTMLParser::reportErrorToConsole):
+        * html/HTMLTokenizer.cpp:
+        (WebCore::HTMLTokenizer::processListing):
+        (WebCore::HTMLTokenizer::parseSpecial):
+        (WebCore::HTMLTokenizer::parseComment):
+        (WebCore::HTMLTokenizer::parseServer):
+        (WebCore::HTMLTokenizer::parseProcessingInstruction):
+        (WebCore::HTMLTokenizer::parseText):
+        (WebCore::HTMLTokenizer::parseEntity):
+        (WebCore::HTMLTokenizer::parseTag):
+        (WebCore::HTMLTokenizer::write):
+        (WebCore::HTMLTokenizer::processToken):
+        (WebCore::HTMLTokenizer::setSrc):
+        * html/HTMLTokenizer.h:
+        (WebCore::HTMLTokenizer::lineNumberPtr):
+        * html/HTMLViewSourceDocument.cpp:
+        (WebCore::HTMLViewSourceDocument::addLine):
+        * loader/TextDocument.cpp:
+        (WebCore::TextTokenizer::write):
+        * platform/SegmentedString.cpp:
+        (WebCore::SegmentedString::SegmentedString):
+        (WebCore::SegmentedString::operator=):
+        (WebCore::SegmentedString::clear):
+        * platform/SegmentedString.h:
+        (WebCore::SegmentedString::SegmentedString):
+        (WebCore::SegmentedString::advance):
+        (WebCore::SegmentedString::escaped):
 -05-23  David Hyatt  <hyatt@apple.com>

trunk/WebCore/html/HTMLParser.cpp

r21522	r21704
1418	1418
1419	1419	HTMLTokenizer* htmlTokenizer = static_cast<HTMLTokenizer*>(document->tokenizer());
1420		int lineNumber = htmlTokenizer->~~tagStartL~~ineNumber() + 1;
	1420	int lineNumber = htmlTokenizer->lineNumber() + 1;
1421	1421
1422	1422	AtomicString tag1;

trunk/WebCore/html/HTMLTokenizer.cpp

-                      r21680
+                      r21704
             state.setSkipLF(false);
             if (*list == '\n') {
                 ++list;
+                list.advance(0);
                 continue;
+            }
 …
                 state.setSkipLF(true);
             ++list;
+            list.advance(0);
         } else {
             state.setDiscardLF(false);
             *dest++ = *list;
             ++list;
+            list.advance(0);
+        }
+    }
 …
     ASSERT(state.inXmp() + state.inTextArea() + state.inTitle() + state.inStyle() + state.inScript() == 1 );
     if (state.inScript())
         scriptStartLineno = lineno + src.lineCount();
+        scriptStartLineno = lineno;
     if (state.inComment())
 …
+        }
         if (scriptCodeResync && !tquote && ch == '>') {
             ++src;
+            src.advance(lineNumberPtr());
             scriptCodeSize = scriptCodeResync-1;
             scriptCodeResync = 0;
 …
         if (!scriptCodeResync && (state.inTextArea() || state.inTitle()) && !src.escaped() && ch == '&') {
             UChar* scriptCodeDest = scriptCode+scriptCodeSize;
             ++src;
+            src.advance(lineNumberPtr());
             state = parseEntity(src, scriptCodeDest, state, m_cBufferPos, true, false);
             scriptCodeSize = scriptCodeDest-scriptCode;
         } else {
             scriptCode[scriptCodeSize++] = *src;
             ++src;
+            src.advance(lineNumberPtr());
+        }
+    }
 …
+            }
             if (handleBrokenComments || endCharsCount > 1) {
                 ++src;
+                src.advance(lineNumberPtr());
                 if (!(state.inTitle() || state.inScript() || state.inXmp() || state.inTextArea() || state.inStyle())) {
                     checkScriptBuffer();
 …
+            }
+        }
         ++src;
+        src.advance(lineNumberPtr());
+    }
 …
         if (*src == '>' &&
             scriptCodeSize > 1 && scriptCode[scriptCodeSize-2] == '%') {
             ++src;
+            src.advance(lineNumberPtr());
             state.setInServer(false);
             scriptCodeSize = 0;
             return state; // Finished parsing server include
+        }
         ++src;
+        src.advance(lineNumberPtr());
+    }
     return state;
 …
             // We got a '?>' sequence
             state.setInProcessingInstruction(false);
             ++src;
+            src.advance(lineNumberPtr());
             state.setDiscardLF(true);
             return state; // Finished parsing comment!
+        }
         ++src;
+        src.advance(lineNumberPtr());
         oldchar = chbegin;
+    }
 …
             state.setSkipLF(false);
             if (cc == '\n') {
                 ++src;
+                src.advance(lineNumberPtr());
                 continue;
+            }
 …
         } else
             *dest++ = cc;
         ++src;
+        src.advance(lineNumberPtr());
+    }
 …
             if(cc == '#') {
                 cBuffer[cBufferPos++] = cc;
                 ++src;
+                src.advance(lineNumberPtr());
                 state.setEntityState(NumericSearch);
+            }
 …
             if (cc == 'x' || cc == 'X') {
                 cBuffer[cBufferPos++] = cc;
                 ++src;
+                src.advance(lineNumberPtr());
                 state.setEntityState(Hexadecimal);
             } else if (cc >= '0' && cc <= '9')
 …
                 EntityUnicodeValue = EntityUnicodeValue * 16 + digit;
                 cBuffer[cBufferPos++] = cc;
                 ++src;
+                src.advance(lineNumberPtr());
+            }
             if (cBufferPos == 10)
 …
                 EntityUnicodeValue = EntityUnicodeValue * 10 + (cc - '0');
                 cBuffer[cBufferPos++] = cc;
                 ++src;
+                src.advance(lineNumberPtr());
+            }
             if (cBufferPos == 9)
 …
                 cBuffer[cBufferPos++] = cc;
                 ++src;
+                src.advance(lineNumberPtr());
+            }
             if (cBufferPos == 9)
 …
                 if (!inViewSourceMode()) {
                     if (*src == ';')
                         ++src;
+                        src.advance(lineNumberPtr());
                     if (EntityUnicodeValue <= 0xFFFF) {
                         checkBuffer();
 …
                     if (*src == ';') {
                         *dest++ = ';';
                         ++src;
+                        src.advance(lineNumberPtr());
+                    }
+                }
 …
     unsigned cBufferPos = m_cBufferPos;
+    while (!src.isEmpty())
+    {
+    int* lineNoPtr = lineNumberPtr();
+    while (!src.isEmpty()) {
         checkBuffer();
         switch(state.tagState()) {
 …
 #endif
                         // Found '<!--' sequence
                         ++src;
+                        src.advance(lineNoPtr);
                         dest = buffer; // ignore the previous part of this tag
                         state.setInComment(true);
 …
                         if (!src.isEmpty() && *src == '>' && m_doc->inCompatMode()) {
                           state.setInComment(false);
                           ++src;
+                          src.advance(lineNoPtr);
                           if (!src.isEmpty())
                               // cuts off high bits, which is okay
 …
                     // cuts off high bits, which is okay
                     cBuffer[cBufferPos++] = *src;
                     ++src;
+                    src.advance(lineNoPtr);
                     break;
+                }
 …
                 else
                     cBuffer[cBufferPos++] = curchar;
                 ++src;
+                src.advance(lineNoPtr);
+            }
 …
                 if (inViewSourceMode())
                     currToken.addViewSourceChar(curchar);
                 ++src;
+                src.advance(lineNoPtr);
+            }
             break;
 …
                     cBuffer[cBufferPos++] = curchar;
                 ++src;
+                src.advance(lineNoPtr);
+            }
             if ( cBufferPos == CBUFLEN ) {
 …
                         if (inViewSourceMode())
                             currToken.addViewSourceChar(curchar);
                         ++src;
+                        src.advance(lineNoPtr);
+                    }
                     else {
 …
                     currToken.flat = true;
                 ++src;
+                src.advance(lineNoPtr);
+            }
             break;
 …
                         if (inViewSourceMode())
                             currToken.addViewSourceChar(curchar);
                         ++src;
+                        src.advance(lineNoPtr);
                     } else
                         state.setTagState(Value);
 …
                 if (inViewSourceMode())
                     currToken.addViewSourceChar(curchar);
                 ++src;
+                src.advance(lineNoPtr);
+            }
             break;
 …
                     if ( curchar == '&' )
+                    {
                         ++src;
+                        src.advance(lineNoPtr);
                         state = parseEntity(src, dest, state, cBufferPos, true, true);
                         break;
 …
                         if (inViewSourceMode())
                             currToken.addViewSourceChar(curchar);
                         ++src;
+                        src.advance(lineNoPtr);
                         break;
+                    }
+                }
                 *dest++ = *src;
                 ++src;
+                src.advance(lineNoPtr);
+            }
             break;
 …
                     if ( curchar == '&' )
+                    {
                         ++src;
+                        src.advance(lineNoPtr);
                         state = parseEntity(src, dest, state, cBufferPos, true, true);
                         break;
 …
                 *dest++ = *src;
                 ++src;
+                src.advance(lineNoPtr);
+            }
             break;
 …
                 if (inViewSourceMode())
                     currToken.addViewSourceChar(*src);
                 ++src;
+                src.advance(lineNoPtr);
+            }
             if (src.isEmpty()) break;
 …
             if (*src != '<')
                 ++src;
+                src.advance(lineNoPtr);
             if (currToken.tagName == nullAtom) { //stop if tag is unknown
 …
     State state = m_state;
+    int* lineNoPtr = lineNumberPtr();
     while (!src.isEmpty() && (!frame || !frame->loader()->isScheduledLocationChangePending())) {
         if (!continueProcessing(processedCount, startTime, state))
 …
         if (wasSkipLF && (cc == '\n'))
             ++src;
+            src.advance(0);
         else if (state.needsSpecialWriteHandling()) {
             // it's important to keep needsSpecialWriteHandling with the flags this block tests
 …
+            }
         } else if (cc == '&' && !src.escaped()) {
             ++src;
+            src.advance(lineNoPtr);
             state = parseEntity(src, dest, state, m_cBufferPos, true, state.hasTagState());
         } else if (cc == '<' && !src.escaped()) {
             tagStartLineno = lineno+src.lineCount();
             ++src;
+            tagStartLineno = lineno;
+            src.advance(lineNoPtr);
             state.setStartTag(true);
         } else if (cc == '\n' || cc == '\r') {
 …
                 // Ignore this LF
                 state.setDiscardLF(false); // We have discarded 1 LF
             else
+            else {
                 // Process this LF
                 *dest++ = '\n';
+                if (cc == '\r')
+                    lineno++;
+            }
             /* Check for MS-DOS CRLF sequence */
             if (cc == '\r')
                 state.setSkipLF(true);
             ++src;
+            src.advance(lineNoPtr);
         } else {
             state.setDiscardLF(false);
             *dest++ = cc;
             ++src;
+            src.advance(lineNoPtr);
+        }
+    }
 …
         currToken.reset();
         if (jsProxy)
             jsProxy->setEventHandlerLineno(lineno+src.lineCount());
+            jsProxy->setEventHandlerLineno(lineno);
         return 0;
+    }
 …
 void HTMLTokenizer::setSrc(const SegmentedString &source)
+{
-    lineno += src.lineCount();
     src = source;
-    src.resetLineCount();
+}

trunk/WebCore/html/HTMLTokenizer.h

r21526	r21704
102	102	virtual int columnNumber() const { return 1; }
103	103
104		int ~~tagStartLineNumber() const { return tagStartL~~ineno; }
	104	int* lineNumberPtr() { return m_executingScript ? 0 : &lineno; }
105	105
106	106	private:

trunk/WebCore/html/HTMLViewSourceDocument.cpp

-                      r21630
+                      r21704
     m_current = m_td = td;
+#ifdef DEBUG_LINE_NUMBERS
+    Text* lineNumberText = new Text(this, String::number(tokenizer()->lineNumber() + 1) + " ");
+    td->addChild(lineNumberText);
+    lineNumberText->attach();
+#endif
     // Open up the needed spans.
     if (!className.isEmpty()) {

trunk/WebCore/loader/TextDocument.cpp

r21599	r21704
88	88	}
89	89
90		~~++str~~;
	90	str.advance(0);
91	91
92	92	// Maybe enlarge the buffer

trunk/WebCore/platform/SegmentedString.cpp

-                      r20495
+                      r21704
 SegmentedString::SegmentedString(const SegmentedString &other) :
     m_pushedChar1(other.m_pushedChar1), m_pushedChar2(other.m_pushedChar2), m_currentString(other.m_currentString),
     m_substrings(other.m_substrings), m_lines(other.m_lines), m_composite(other.m_composite)
+    m_substrings(other.m_substrings), m_composite(other.m_composite)
+{
     if (other.m_currentChar == &other.m_pushedChar1)
 …
     m_currentString = other.m_currentString;
     m_substrings = other.m_substrings;
-    m_lines = other.m_lines;
     m_composite = other.m_composite;
     if (other.m_currentChar == &other.m_pushedChar1)
 …
     m_currentString.clear();
     m_substrings.clear();
-    m_lines = 0;
     m_composite = false;
+}

trunk/WebCore/platform/SegmentedString.h

-                      r20496
+                      r21704
 public:
     SegmentedString()
+        : m_pushedChar1(0), m_pushedChar2(0), m_currentChar(0)
+        , m_lines(0), m_composite(false) {}
+        : m_pushedChar1(0), m_pushedChar2(0), m_currentChar(0), m_composite(false) {}
     SegmentedString(const UChar* str, int length) : m_pushedChar1(0), m_pushedChar2(0)
+        , m_currentString(str, length), m_currentChar(m_currentString.m_current)
+        , m_lines(0), m_composite(false) {}
+        , m_currentString(str, length), m_currentChar(m_currentString.m_current), m_composite(false) {}
     SegmentedString(const String& str)
         : m_pushedChar1(0), m_pushedChar2(0), m_currentString(str)
+        , m_currentChar(m_currentString.m_current)
+        , m_lines(0), m_composite(false) {}
+        , m_currentChar(m_currentString.m_current), m_composite(false) {}
     SegmentedString(const SegmentedString&);
 …
     unsigned length() const;
     void advance() {
+    void advance(int* lineNumber = 0) {
         if (m_pushedChar1) {
             m_pushedChar1 = m_pushedChar2;
             m_pushedChar2 = 0;
         } else if (m_currentString.m_current) {
+            m_lines += *m_currentString.m_current++ == '\n';
+            if (*m_currentString.m_current++ == '\n' && lineNumber)
+                *lineNumber = *lineNumber + 1;
             if (--m_currentString.m_length == 0)
                 advanceSubstring();
 …
     bool escaped() const { return m_pushedChar1; }
-    int lineCount() const { return m_lines; }
-    void resetLineCount() { m_lines = 0; }
     String toString() const;
-    void operator++() { advance(); }
     const UChar& operator*() const { return *current(); }
     const UChar* operator->() const { return current(); }
 …
     const UChar* m_currentChar;
     DeprecatedValueList<SegmentedSubstring> m_substrings;
-    int m_lines;
     bool m_composite;
 };

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 21704 in webkit

Legend:

Download in other formats: