본문 바로가기

Software

처음부터 모든 웹 사이트에서 검색 기능을 구축하는 방법

반응형

1. 어떤 이유로 사이트를 보시겠습니까

독방 물질 사이트의 경우, 검색은 실제로 고객의 기본 용량이 아닙니다. 고객은 대체로 고객이 다른 사람에게 물어보아야한다는 사실에 비추어 볼 때 믿을 수없는 당사자입니다. 고객이 다른 사람으로부터 필요한 물질을 얻을 수없는 시점에서 고객은 일반적으로이 활동을 추구하게되며이 활동이 발생하는 지구는 일반적으로 다른 물질 사이트에 있지 않으며 Google과 Baidu를 활용해야합니다. 웹 색인을 위해 매 달리십시오. 고객의 관점에서 볼 때 반드시 그렇게하는 것이 좋으며, 더 저렴한 비용으로 필요한 것을 찾을 확률을 높일 수 있습니다. 그러나 어떤 이유로 다른 물질 사이트가 자체 추구를해야합니까?

1. 고객이 데이터를 얻을 수있을 정도로 빈약 한 사이트를 떠나도록합니다.

고객이 웹 크롤러를 통해이 웹 페이지에서 데이터를 획득 할 수있는 가능성이있을 경우, 귀하의 사이트는 고객 검색 키워드 위치에 기본 페이지를 입력 할 수 없습니다. 사실, 우리는 웹 인덱스가이 웹 사이트에서 데이터를 받도록 허용한다는 첫 번째 기대는 기존 클라이언트를 유지하는 것이 아니라 점진적으로 정확한 클라이언트를 얻는 것이 아니라는 사실을 알고 있습니다. 결과적으로 사이트 검색의 기본 동기는이 사이트에 대한 고객의 이용률을 확대하고 클라이언트 검색 캐치 프레이즈 정보를 얻는 것입니다. 그러나이 부분은 집계 할 이상적인 기회가 필요합니다.

2. 몇몇 사이트는 정보를 열지 않습니다

일부 사이트는 비즈니스, 주요 및 다른 이유로 인해 웹 인덱스에 정보를 열지 않습니다. 고객이 컨텐츠를 발견하는 비용을 줄이기 위해 가까운 문의를하는 것은 불가피한 결정입니다. 웹 기반 비즈니스 및 O2O와 같은 단계에서 대부분이 놀라운 일이 발생합니다. 동시에, 다목적 인터넷의 개선과 진입 및 고객 성향의 변화로 인해 데이터 제도가 빠르게 확장되었으며 더 많은 단계가 정보를 개방하거나 개방하지 않기로 결정했습니다. (요즘에는 이전 Xiaomi 항목과 ebb 및 flow WeChat 검색과 같이이 놀라운 일을 시도하는 괴물이 있습니다)

3. 고객 성향의 변화

이 부분에서 앞서 언급했듯이 인터넷에 대한 현재 가장 큰 액세스는 일반적인 PC 조건 (예 : 프로그램)에서 휴대폰의 응용 프로그램으로 이동했습니다. 클라이언트에 도입 된 구조는이 시점에서 모호한 URL의 진행은 아니지만 다목적 작업 영역에서 명백한 화려한 색조의 App 기호입니다. 클라이언트가 기존 PC에서 톤을 사용하는 사이트 모음 페이지와 관련하여 다른 App Store에 의해 대체됩니다. 고객이 앱에 진입 할 때 현재 앱의 내용 만 소개됩니다. 이 상황에서 클라이언트는 자연스럽게 앱에서 추구를 활용하기로 결정합니다.

어쨌든 사이트 검색을 수행 할 때 명확히해야 할 몇 가지 문제가 있습니다.

(1) 발전 비용은 일반적으로 높습니다

필요성이 높고 멋진 만남으로 사이트 검색을 수행해야하는 경우 일반적으로 다음과 같이 분할 할 수있는 많은 항목이 있습니다.

각 부분은 마지막 고객 경험에 직접적인 영향을 미칩니다.

분명히, 당신이 쉬워 지거나 물질적 인 다각적 인 성격이 낮을 가능성이있을 때, MVP 예비 사용법 등은 푹신한 질문에 SQL을 사용하는 것을 고려할 수 있습니다. 검색 단어 준비 (실수 수정, 개정, 단어 나누기 등)

(2) 상대적으로 낮은 정보 수율 비율

개선 비용이 적당히 높다고 전에 언급했습니다. 발전이 완료된 후이 용량의 사용 속도는 얼마입니까? 살펴보면 기능적인 행동입니다. 추가 구성 요소 및 상품이 없으면 고객이 잠복합니다. 대부분의 단계에서 HowNet, Taobao 및 Zhihu와 같은 단계 인 경우를 제외하고는 이에 상응하여이 용량의 사용률이 지나치게 높지는 않습니다. 이것은 마찬가지로 중요한 일이지만 진지한 사업은 아닙니다. 사이트에서 사이트를 찾아야 할 필요성은 휴대 전화로 인스턴트 메시지를 보내는 기능과 다소 유사합니다. 고객은 그것을 사용할 수는 없지만 사용할 수는 없습니다.

(3) 물질의 측정

헌팅 작업을 수행 할 때 콘텐츠를 검색하기에 적합하지 않은 것이 가장 굴욕적인 시간입니다. 예를 들어, 비교 물질 제안, 잘 알려진 문의 제안 등과 같은 몇 가지 전략이 이용 될 수 있지만; 그러나 일반적인 조건 하에서 (고객이 전형적인 단어와 문장을 스캔하고, 단계와 함께 식별됩니다) 물질을 찾을 수 없다면 취급에도 불구하고, 중앙 고객 숙련도 문제는 아직 완전하지 않습니다 안정된.

 

2. 검색 : 단어, 조정, 정리

특정 물질에 대해 논의하기 전에 웹 색인 검색 전략 사이트를 제시해야합니다. 이것은 모든 사람이 자주 사용하는 헌트 절차로 간주되어야합니다. 이러한 종류의 검색 전략은 중요한 웹 크롤러가 제공하는 무료 사이트 검색으로 이해 될 수 있습니다.

이 시점에서 문제가 있는데 왜 웹 인덱스 기술을 웹 사이트에서 웹 사이트 검색으로 활용하지 않습니까? 실제로는 V2EX와 같은 사이트가 있습니다. 위치 검색에 웹 크롤러를 활용하면 엄청나게 낮은 고급 비용, 낮은 고객 비용, 일반적으로 추구하는 정확성 등과 같은 여러 가지 이점이 있습니다.

어쨌든 실제로 몇 가지 단점이 있습니다.

첫 번째는 정리입니다. 웹 크롤러의 정렬 계산이 중보기를 지나서 비즈니스에 필요한 정렬을 제공하지 못합니다. 예를 들어, 제품 사이트, 검색 밥솥, 웹 색인은 더 중요하고 시간 등이 될 수 있지만 실제로는 비즈니스 수준에서 거래량, 호평 률 등도 마찬가지로 중요한 고려 사항이며 이러한 정보는 웹 색인이 외부에 제공 될 수 있는지 여부에 관계없이 웹 색인이 가중치에 대해 기억 될 수 있는지 여부를 명시하지 마십시오. 이 시점에서 다양한 종류의 사이트에서 발생하는 정보 유형 문제가 있습니다. 데이터, Q & A, 인력 그룹, 품목 등의 기초는 완전히 독특한 접근성 물질을 제공하며, 이제 웹 크롤러는 최대한 완벽하게 이행 할 수 없습니다. 부품의 물질 종류. 후자는 업데이트입니다. 현재 웹 크롤러가 사이트 참여를 신속하게 통합 할 수 있도록하는 가장 표준적인 접근 방식은 웹 페이지 맵이지만 웹 사이트 맵과 관련된 가장 큰 문제는 시간이 새로 고쳐지지 않으며 언제 업데이트 될지 예측하기 어렵다는 것입니다. 출원 및시기. 포함되어 있습니다.

1. 검색어 처리

현재 추구 용어를 분류하기위한보다 일반적인 접근 방식은 단어 분할 및 실수 수정입니다.

현재는 이전보다 훨씬 간단합니다. 엄청난 수의 오픈 소스 워드 분할 구조 라이브러리도 GitHub에서 액세스 할 수 있으며 추가로 사용자 정의를 강화합니다. 이 제안이 끝나면 고객의 문의 용어를 신중하게 수집하여 단어 구분이 해당 시점에서 고객이 의사 소통 할 계획임을 암시하는지 확인해야합니다. 동시에 비즈니스와 균형을 이루어야합니다. 예를 들어, 온라인 비즈니스 단계에서 "브릴리언트 TV"를 검색 할 가능성이 높으면 "열심히" "텔레비전"만 찾을 수 없습니다. "스마트 TV"도 마찬가지로 감시 어로 존재해야합니다. 마지막은 현재의 실수로 인한 조정이 그것을 할 가능성이 거의 없다는 것을 나타내지 않는다는 이유로 다소 점진적으로 번거 롭습니다. 결과.

특히 실수를 해결하는 한 (범죄 정류 절차는 일반적으로 부적절한 성격 (단어) → 부적절한 성격 (단어)의 조정에 대한 승인입니다). 문법 오류 (단어)는 때때로 단어 분할 영향에 영향을 미치고 쿼리 항목에 영향을 미치므로 아직 수행해야 할 중요한 사항이지만 클라이언트 수가 많을 때 수행하는 것이 더 현명합니다. 정보는 점차 풍부합니다. 또한 나중에 더 많은 내부 및 외부 고객 검색어 예측을 포함시킬 수 있습니다. 이것은 상당히 점진적으로 혼동됩니다. 나는 그것을 얻지 못하므로 더 이상 진술하지 않을 것입니다.

2. 경기

인터넷에서 볼 수있는 것을 정보라고하며 대부분의 정보는 데이터베이스의 테이블에 있습니다. 조정의 핵심은 추구 조건을 활용하여이 표에서 적절한 정보를 찾는 것입니다. 그럴 수도 있지만, 이것은 너무 낭비입니다. 효과와 정확성을 향상시키기 위해 문의 범위를 나타내는 것이 일반적이므로 우리는 일반적으로 사냥을 준비합니다. 예를 들어이 캐치 프레이즈는 항목을 살펴 보는 데 사용되며이 워치 워드는 기사를 살펴 보는 데 사용됩니다. 유사한 종류의 정보, 예를 들어 기사는 정보, 예를 들어 제목, 작가, 시간, 내용, 비고 등을 포함 할 수있다. 그래서 당신의 경기는 어떤 정보를 퍼 뜨리나요? 표제? 창조자? 시각? 아니면 다른 한편으로 내용?

위의 많은 부분이 조정을 수행해야 할 가능성이있는 경우,이를 다중 필드 조정 또는 다중 필드 검색이라고합니다. 가장 간단한 경로는 다른 필드를 통합하여 레코드를 작성하는 것입니다.
또한 모든 내용에도 불구하고이 기사의 내용을 찾아야하고 기사의 내용이 매우 긴 내용이나 텍스트 구조 인 경우에는 지원을 위해 전체 내용을 조정해야 할 수도 있습니다.

 

3. 정렬
정렬은 일반적으로 관련성, 콘텐츠 사용자 관련 데이터, 시간 등을 기반으로하며 비즈니스 특성에 더 의존합니다. 예를 들어, 뉴스 웹 사이트는 시간 차원에서 더 많은 가중치를 가질 수 있습니다. 전자 상거래 웹 사이트는 판매, 인기도, 이익 및 할인에 더 많은주의를 기울일 수 있습니다 (예를 들어, 특정 할인 기간 동안 카테고리에서 더 많은 이익을 가진 제품이 사용자를 끌어 들이기 위해 표시됨). 콘텐츠 웹 사이트는 또한 사용자가 그것을 읽었는지 여부를 포함하여, 사용자가 몇 마디로 이전에 소비 한 기사를 찾고자하는 시나리오를 해결한다.

3. 사용자 관점
이 부분은 상대적으로 설계되었으며 전체 검색의 마지막 부분이기도합니다. 아마 참조하기 위해 몇 가지 사항을 컴파일했습니다.

1. 검색 창 위치
현재 웹 사이트 및 앱에서 검색 창 위치는 일반적으로 최상위입니다. 이 위치는 일반적인 컨텐츠 소비를 차단하지 않으며 사용하기 매우 편리한 위치입니다. 개인적으로, 사용자 습관을 고려하여 특별한 상황이나 제품 구조 경향이없는 경우 맨 위에 배치 할 것을 권장합니다. 검색 상자 형식이 아닐 수도 있지만 기능을 찾는 사용자의 비용을 줄이려면 명확하게 표시해야합니다. .

2. 소개
소개 텍스트는 입력되지 않은 검색 상자의 프롬프트를 나타냅니다. 고대에는 "검색 키워드를 입력하십시오"라고 말하는 것이 일반적이지만이 위치는 여전히 더 중요합니다. 중요한 정보를 미리 표시 할 수 있으며 프로모션 채널로 사용할 수 있습니다. 따라서 운영자와 논의하여 처리 방법을 결정하는 것이 좋습니다.

3. 인기있는 검색어
클릭하여 검색하면 일부 앱과 웹 사이트에서 인기있는 검색어가 표시됩니다. 이 검색어는 소개 텍스트뿐만 아니라 사용자를 안내하는 역할을 할 수 있으며 동시에 사용자 비용을 어느 정도 줄일 수 있습니다.

그러나이 부분은 수행하기 쉽지 않으며 (주로 운영 규칙 및 논리) 그 효과는 일반적으로 초기 단계에서 명확하지 않습니다. 초기 단계에서는하지 않는 것이 좋습니다.

4. 검색 기록
이것은 대부분의 웹 사이트 또는 앱에서 사용자 경험을 보완하는 기능이지만 필요한 것은 아닙니다. 개인적으로이 기능은 핫 검색과 함께 초기 단계에서 수행 할 필요가없는 기능이라고 생각합니다.

5. 결과가 상대적으로 적거나 없다
결과가 거의 없거나 전혀 없으며 때로는 데이터 문제는 아니지만 오류 수정 등 이전 검색어 처리 문제가 있습니다. 그러나 결국 사용자에게 표시되었으므로 여전히 생각해야합니다. 그것을 보여주는 방법에 대해. 사용자의 기대에 더 잘 맞기 때문에 관련성이 높은 콘텐츠를 표시하는 것이 좋습니다. 물론 관련성에 중점을 두며 관련성에 대한 이해는 비즈니스 (제품 분류, 제품 범주 및 존재할 수있는 특정 SKU 속성, 직업 또는 도시 또는 산업)에 따라 달라집니다 등

반응형