Context Navigation

← Previous Changeset
Next Changeset →

Changeset 121858 in webkit

Timestamp:

Jul 4, 2012 8:31:53 AM (12 years ago)

Author:

kseo@webkit.org

Message:

Stop tracking line number in tokenizer
https://bugs.webkit.org/show_bug.cgi?id=90544

Reviewed by Adam Barth.

Because SegmentedString knows how to track the current line and column,
a tokenizer does not need to keep track of the current line by itself.
No behavior change, so no new tests.

html/parser/HTMLDocumentParser.cpp:

(WebCore::HTMLDocumentParser::pumpTokenizer):
(WebCore::HTMLDocumentParser::lineNumber):
(WebCore::HTMLDocumentParser::textPosition):

html/parser/HTMLTokenizer.cpp:

(WebCore::HTMLTokenizer::reset):
(WebCore::HTMLTokenizer::flushBufferedEndTag):
(WebCore):
(WebCore::HTMLTokenizer::nextToken):

html/parser/HTMLTreeBuilder.cpp:

(WebCore::HTMLTreeBuilder::processScriptStartTag):

html/track/WebVTTTokenizer.cpp:

(WebCore::WebVTTTokenizer::reset):
(WebCore::WebVTTTokenizer::nextToken):

platform/text/SegmentedString.cpp:

(WebCore::SegmentedString::advanceAndUpdateLineNumberSlowCase):

platform/text/SegmentedString.h:

(WebCore::SegmentedString::advancePastNewlineAndUpdateLineNumber):
(WebCore::SegmentedString::advanceAndUpdateLineNumber):
(SegmentedString):

xml/parser/MarkupTokenizerBase.h:

(WebCore::MarkupTokenizerBase::InputStreamPreprocessor::peek):
(WebCore::MarkupTokenizerBase::InputStreamPreprocessor::advance):
(WebCore::MarkupTokenizerBase::emitAndResumeIn):
(WebCore::MarkupTokenizerBase::emitEndOfFile):
(WebCore::MarkupTokenizerBase::reset):
(MarkupTokenizerBase):

xml/parser/MarkupTokenizerInlineMethods.h:

(WebCore):

xml/parser/XMLTokenizer.cpp:

(WebCore::XMLTokenizer::nextToken):

Location:

trunk/Source/WebCore

Files:

: 10 edited

ChangeLog (modified) (1 diff)
html/parser/HTMLDocumentParser.cpp (modified) (4 diffs)
html/parser/HTMLTokenizer.cpp (modified) (4 diffs)
html/parser/HTMLTreeBuilder.cpp (modified) (1 diff)
html/track/WebVTTTokenizer.cpp (modified) (2 diffs)
platform/text/SegmentedString.cpp (modified) (2 diffs)
platform/text/SegmentedString.h (modified) (5 diffs)
xml/parser/MarkupTokenizerBase.h (modified) (8 diffs)
xml/parser/MarkupTokenizerInlineMethods.h (modified) (2 diffs)
xml/parser/XMLTokenizer.cpp (modified) (1 diff)

Legend:

: Unmodified
: Added
: Removed

trunk/Source/WebCore/ChangeLog

-                      r121857
+                      r121858
+-07-04  Kwang Yul Seo  <skyul@company100.net>
+        Stop tracking line number in tokenizer
+        https://bugs.webkit.org/show_bug.cgi?id=90544
+        Reviewed by Adam Barth.
+        Because SegmentedString knows how to track the current line and column,
+        a tokenizer does not need to keep track of the current line by itself.
+        No behavior change, so no new tests.
+        * html/parser/HTMLDocumentParser.cpp:
+        (WebCore::HTMLDocumentParser::pumpTokenizer):
+        (WebCore::HTMLDocumentParser::lineNumber):
+        (WebCore::HTMLDocumentParser::textPosition):
+        * html/parser/HTMLTokenizer.cpp:
+        (WebCore::HTMLTokenizer::reset):
+        (WebCore::HTMLTokenizer::flushBufferedEndTag):
+        (WebCore):
+        (WebCore::HTMLTokenizer::nextToken):
+        * html/parser/HTMLTreeBuilder.cpp:
+        (WebCore::HTMLTreeBuilder::processScriptStartTag):
+        * html/track/WebVTTTokenizer.cpp:
+        (WebCore::WebVTTTokenizer::reset):
+        (WebCore::WebVTTTokenizer::nextToken):
+        * platform/text/SegmentedString.cpp:
+        (WebCore::SegmentedString::advanceAndUpdateLineNumberSlowCase):
+        * platform/text/SegmentedString.h:
+        (WebCore::SegmentedString::advancePastNewlineAndUpdateLineNumber):
+        (WebCore::SegmentedString::advanceAndUpdateLineNumber):
+        (SegmentedString):
+        * xml/parser/MarkupTokenizerBase.h:
+        (WebCore::MarkupTokenizerBase::InputStreamPreprocessor::peek):
+        (WebCore::MarkupTokenizerBase::InputStreamPreprocessor::advance):
+        (WebCore::MarkupTokenizerBase::emitAndResumeIn):
+        (WebCore::MarkupTokenizerBase::emitEndOfFile):
+        (WebCore::MarkupTokenizerBase::reset):
+        (MarkupTokenizerBase):
+        * xml/parser/MarkupTokenizerInlineMethods.h:
+        (WebCore):
+        * xml/parser/XMLTokenizer.cpp:
+        (WebCore::XMLTokenizer::nextToken):
 -07-04  Ryuan Choi  <ryuan.choi@samsung.com>

trunk/Source/WebCore/html/parser/HTMLDocumentParser.cpp

-                      r103999
+                      r121858
     // end up parsing the whole buffer in this pump.  We should pass how
     // much we parsed as part of didWriteHTML instead of willWriteHTML.
     InspectorInstrumentationCookie cookie = InspectorInstrumentation::willWriteHTML(document(), m_input.current().length(), m_tokenizer->lineNumber().zeroBasedInt());
+    InspectorInstrumentationCookie cookie = InspectorInstrumentation::willWriteHTML(document(), m_input.current().length(), m_input.current().currentLine().zeroBasedInt());
     while (canTakeNextToken(mode, session) && !session.needsYield) {
 …
+    }
     InspectorInstrumentation::didWriteHTML(cookie, m_tokenizer->lineNumber().zeroBasedInt());
+    InspectorInstrumentation::didWriteHTML(cookie, m_input.current().currentLine().zeroBasedInt());
+}
 …
 OrdinalNumber HTMLDocumentParser::lineNumber() const
+{
     return m_tokenizer->lineNumber();
+    return m_input.current().currentLine();
+}
 …
     OrdinalNumber line = currentString.currentLine();
     OrdinalNumber column = currentString.currentColumn();
-    ASSERT(m_tokenizer->lineNumber() == line);
     return TextPosition(line, column);

trunk/Source/WebCore/html/parser/HTMLTokenizer.cpp

-                      r103999
+                      r121858
     m_state = HTMLTokenizerState::DataState;
     m_token = 0;
-    m_lineNumber = 0;
     m_forceNullCharacterReplacement = false;
     m_shouldAllowCDATA = false;
 …
+{
     ASSERT(m_token->type() == HTMLTokenTypes::Character || m_token->type() == HTMLTokenTypes::Uninitialized);
     source.advance(m_lineNumber);
+    source.advanceAndUpdateLineNumber();
     if (m_token->type() == HTMLTokenTypes::Character)
         return true;
 …
             return true;                                                   \
         if (source.isEmpty()                                               \
             || !m_inputStreamPreprocessor.peek(source, m_lineNumber))      \
+            || !m_inputStreamPreprocessor.peek(source))                    \
             return haveBufferedCharacterToken();                           \
         cc = m_inputStreamPreprocessor.nextInputCharacter();               \
 …
+    }
     if (source.isEmpty() || !m_inputStreamPreprocessor.peek(source, m_lineNumber))
+    if (source.isEmpty() || !m_inputStreamPreprocessor.peek(source))
         return haveBufferedCharacterToken();
     UChar cc = m_inputStreamPreprocessor.nextInputCharacter();

trunk/Source/WebCore/html/parser/HTMLTreeBuilder.cpp

r121683	r121858
2647	2647	TextPosition position = m_parser->textPosition();
2648	2648
2649		~~ASSERT(position.m_line == m_parser->tokenizer()->lineNumber());~~
2650
2651	2649	m_lastScriptElementStartPosition = position;
2652	2650

trunk/Source/WebCore/html/track/WebVTTTokenizer.cpp

-                      r95901
+                      r121858
     m_state = WebVTTTokenizerState::DataState;
     m_token = 0;
-    m_lineNumber = 0;
     m_buffer.clear();
+}
 …
     m_token = &token;
     if (source.isEmpty() || !m_inputStreamPreprocessor.peek(source, m_lineNumber))
+    if (source.isEmpty() || !m_inputStreamPreprocessor.peek(source))
         return haveBufferedCharacterToken();

trunk/Source/WebCore/platform/text/SegmentedString.cpp

-                      r121523
+                      r121858
+}
 void SegmentedString::advanceSlowCase(int& lineNumber)
+void SegmentedString::advanceAndUpdateLineNumberSlowCase()
+{
     if (m_pushedChar1) {
 …
     } else if (m_currentString.m_current) {
         if (*m_currentString.m_current++ == '\n' && m_currentString.doNotExcludeLineNumbers()) {
-            ++lineNumber;
             ++m_currentLine;
             // Plus 1 because numberOfCharactersConsumed value hasn't incremented yet; it does with m_length decrement below.

trunk/Source/WebCore/platform/text/SegmentedString.h

r121523	r121858
158	158	}
159	159
160		void advancePastNewline~~(int& lineNumber~~)
	160	void advancePastNewlineAndUpdateLineNumber()
161	161	{
162	162	ASSERT(*current() == '\n');
163	163	if (!m_pushedChar1 && m_currentString.m_length > 1) {
164	164	int newLineFlag = m_currentString.doNotExcludeLineNumbers();
165		~~lineNumber += newLineFlag;~~
166	165	m_currentLine += newLineFlag;
167	166	if (newLineFlag)
…	…
171	170	return;
172	171	}
173		advance~~SlowCase(lineNumber~~);
	172	advanceAndUpdateLineNumberSlowCase();
174	173	}
175	174
…	…
185	184	}
186	185
187		void advance~~(int& lineNumber~~)
	186	void advanceAndUpdateLineNumber()
188	187	{
189	188	if (!m_pushedChar1 && m_currentString.m_length > 1) {
190	189	int newLineFlag = (*m_currentString.m_current == '\n') & m_currentString.doNotExcludeLineNumbers();
191		~~lineNumber += newLineFlag;~~
192	190	m_currentLine += newLineFlag;
193	191	if (newLineFlag)
…	…
197	195	return;
198	196	}
199		advance~~SlowCase(lineNumber~~);
	197	advanceAndUpdateLineNumberSlowCase();
200	198	}
201	199
…	…
235	233
236	234	void advanceSlowCase();
237		void advance~~SlowCase(int& lineNumber~~);
	235	void advanceAndUpdateLineNumberSlowCase();
238	236	void advanceSubstring();
239	237	const UChar* current() const { return m_currentChar; }

trunk/Source/WebCore/xml/parser/MarkupTokenizerBase.h

-                      r103102
+                      r121858
     virtual ~MarkupTokenizerBase() { }
-    OrdinalNumber lineNumber() const { return OrdinalNumber::fromZeroBasedInt(m_lineNumber); }
     typename State::State state() const { return m_state; }
     void setState(typename State::State state) { m_state = state; }
 …
         // The only way we can fail to peek is if there are no more
         // characters in |source| (after collapsing \r\n, etc).
         ALWAYS_INLINE bool peek(SegmentedString& source, int& lineNumber)
+        ALWAYS_INLINE bool peek(SegmentedString& source)
+        {
         PeekAgain:
 …
             if (m_nextInputCharacter == '\n' && m_skipNextNewLine) {
                 m_skipNextNewLine = false;
                 source.advancePastNewline(lineNumber);
+                source.advancePastNewlineAndUpdateLineNumber();
                 if (source.isEmpty())
                     return false;
 …
         // Returns whether there are more characters in |source| after advancing.
         bool advance(SegmentedString& source, int& lineNumber)
+        {
             source.advance(lineNumber);
+        bool advance(SegmentedString& source)
+        {
+            source.advanceAndUpdateLineNumber();
             if (source.isEmpty())
                 return false;
             return peek(source, lineNumber);
+            return peek(source);
+        }
 …
+    {
         m_state = state;
         source.advance(m_lineNumber);
+        source.advanceAndUpdateLineNumber();
         return true;
+    }
 …
             return true;
         m_state = State::DataState;
         source.advance(m_lineNumber);
+        source.advanceAndUpdateLineNumber();
         m_token->clear();
         m_token->makeEndOfFile();
 …
         m_state = State::DataState;
         m_token = 0;
-        m_lineNumber = 0;
+    }
 …
     // this member might be pointing to unallocated memory.
     Token* m_token;
-    int m_lineNumber;
     bool m_forceNullCharacterReplacement;

trunk/Source/WebCore/xml/parser/MarkupTokenizerInlineMethods.h

-                      r95901
+                      r121858
     do {                                                                   \
         m_state = prefix::stateName;                                       \
         if (!m_inputStreamPreprocessor.advance(source, m_lineNumber))      \
+        if (!m_inputStreamPreprocessor.advance(source))                    \
             return haveBufferedCharacterToken();                           \
         cc = m_inputStreamPreprocessor.nextInputCharacter();               \
 …
     do {                                                                   \
         m_state = prefix::stateName;                                       \
         if (source.isEmpty() || !m_inputStreamPreprocessor.peek(source, m_lineNumber)) \
+        if (source.isEmpty() || !m_inputStreamPreprocessor.peek(source))   \
             return haveBufferedCharacterToken();                           \
         cc = m_inputStreamPreprocessor.nextInputCharacter();               \

trunk/Source/WebCore/xml/parser/XMLTokenizer.cpp

r95901	r121858
226	226	m_token = &token;
227	227
228		if (source.isEmpty() \|\| !m_inputStreamPreprocessor.peek(source~~, m_lineNumber~~))
	228	if (source.isEmpty() \|\| !m_inputStreamPreprocessor.peek(source))
229	229	return haveBufferedCharacterToken();
230	230	UChar cc = m_inputStreamPreprocessor.nextInputCharacter();

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 121858 in webkit

Legend:

Download in other formats: