Skip to main content

బయేసియన్ స్పామ్ ఫిల్టరింగ్ అంటే ఏమిటి?

:

Anonim

బయేసియన్ స్పామ్ ఫిల్టర్లు దాని కంటెంట్ల ఆధారంగా ఒక స్పామ్ అనే సందేశం యొక్క సంభావ్యతను లెక్కించవచ్చు. సాధారణ కంటెంట్-ఆధారిత ఫిల్టర్ల మాదిరిగా కాకుండా, బయేసియన్ స్పామ్ వడపోత స్పామ్ నుండి మరియు మంచి మెయిల్ నుండి నేర్చుకుంటుంది, దీని ఫలితంగా చాలా బలమైన, అనుకూలమైన మరియు సమర్థవంతమైన యాంటీ-స్పామ్ విధానం ఫలితంగా, అన్నింటిలోనూ ఉత్తమమైనవి ఏ తప్పుడు పాజిటివ్లను అందిస్తుంది.

మీరు వ్యర్థ ఇమెయిల్ని ఎలా గుర్తించగలను?

స్పామ్ను ఎలా గుర్తించాలో గురించి ఆలోచించండి. త్వరిత వీక్షణం తరచుగా సరిపోతుంది. స్పామ్ ఎలా కనిపిస్తుందో మీకు తెలుసా, మరియు మంచి మెయిల్ ఎలా ఉంటుందో మీకు తెలుస్తుంది.

స్పామ్ యొక్క సంభావ్యత మంచి మెయిల్ లాగా ఉంటుంది … సున్నా.

కంటెంట్ ఆధారిత ఫిల్టర్లను స్కోర్ చేయవద్దు

ఆటోమేటిక్ స్పామ్ ఫిల్టర్లు ఇలా పనిచేస్తే అది గొప్పది కాదా?

కంటెంట్ ఆధారిత స్పామ్ ఫిల్టర్లను స్కోర్ చేస్తే అది ప్రయత్నించండి. వారు స్పామ్కు సంబంధించిన పదాలు మరియు ఇతర లక్షణాల కోసం చూస్తారు. ప్రతి లక్షణ మూలకం స్కోరు కేటాయించబడుతుంది మరియు మొత్తం సందేశానికి స్పామ్ స్కోర్ వ్యక్తిగత స్కోర్ల నుండి గణించబడుతుంది. కొందరు స్కోరింగ్ ఫిల్టర్లు చట్టబద్ధమైన మెయిల్ యొక్క లక్షణాలకు కూడా కనిపిస్తాయి, ఇవి సందేశాన్ని తుది గణనను తగ్గించాయి.

స్కోరింగ్ ఫిల్టర్లు విధానం పని చేస్తుంది, కానీ అది కూడా అనేక లోపాలు ఉన్నాయి:

  • లక్షణాలు జాబితా వడపోత ఇంజనీర్లకు స్పామ్ (మరియు మంచి మెయిల్) అందుబాటులో ఉంటుంది. విలక్షణమైన స్పామ్ యొక్క మంచి గ్రహింపును ఎవరైనా పొందవచ్చు, మెయిల్ తప్పనిసరిగా వందల ఇమెయిల్ చిరునామాలలో సేకరించాలి. ఇది ఫిల్టర్ల సామర్థ్యాన్ని బలహీనపరుస్తుంది, ముఖ్యంగా ఎందుకంటే మంచి మెయిల్ లక్షణాలు ప్రతి వ్యక్తికి భిన్నంగా ఉంటాయి , కానీ ఇది ఖాతాలోకి తీసుకోబడదు.
  • చూసే లక్షణాలు ఎక్కువ లేదా తక్కువగా ఉన్నాయి రాతిలో అమరు . స్పామర్లు స్వీకరించడానికి ప్రయత్నం చేస్తే (వారి స్పామ్ ఫిల్టర్లకు మంచి మెయిల్ లాగా ఉంటుంది), వడపోత లక్షణాలు మానవీయంగా tweaked ఉండాలి - ఒక పెద్ద ప్రయత్నం.
  • ప్రతి పదానికి కేటాయించిన స్కోరు బహుశా మంచి అంచనా ఆధారంగా ఉంటుంది, కానీ ఇది ఇప్పటికీ అనియతగా ఉంటుంది. మరియు లక్షణాలు జాబితా వంటి, ఇది సాధారణంగా స్పామ్ మారుతున్న ప్రపంచానికి లేదా ఒక వ్యక్తి వినియోగదారు యొక్క అవసరాలకు స్వీకరించడం లేదు.

బయేసియన్ స్పామ్ వడపోతలు స్వయంగా సర్దుకుంటూ, బెటర్ మరియు బెటర్ పొందడం

బయేసియన్ స్పామ్ ఫిల్టర్లు కూడా కంటెంట్ ఆధారిత ఫిల్టర్లను స్కోర్ చేస్తాయి. సాధారణ విధానం యొక్క స్పామ్ ఫిల్టర్ల సమస్యలతో వారి పద్ధతి దూరంగా ఉంటుంది, అయితే ఇది చాలా తీవ్రంగా ఉంటుంది. స్కోరింగ్ ఫిల్టర్ల బలహీనత మానవీయంగా లక్షణాలు మరియు వారి స్కోర్ల జాబితాలో ఉంది కాబట్టి, ఈ జాబితా తొలగించబడుతుంది.

బదులుగా, బయేసియన్ స్పామ్ ఫిల్టర్లు తమ జాబితాను నిర్మించాయి. ఆదర్శవంతంగా, మీరు స్పామ్గా వర్గీకరించిన ఒక పెద్ద (పెద్ద) సమూహం మరియు మంచి మెయిల్ యొక్క మరొక సమూహంతో ప్రారంభించండి. స్పామ్లో కనిపించే వివిధ లక్షణాల సంభావ్యత మరియు మంచి మెయిల్లో ఫిల్టర్లు రెండింటినీ పరిశీలిస్తాయి మరియు చట్టబద్ధమైన మెయిల్ అలాగే స్పామ్ను విశ్లేషిస్తాయి.

ఎలా ఒక బయేసియన్ స్పామ్ వడపోత ఒక ఇమెయిల్ పరీక్షలు

బయేసియన్ స్పామ్ వడపోత లక్షణాలు చూడవచ్చు:

  • సందేశాన్ని యొక్క శరీరం లో పదాలు, కోర్సు యొక్క, మరియు
  • దాని శీర్షికలు (పంపినవారు మరియు సందేశ మార్గాలు, ఉదాహరణకు!), కానీ కూడా
  • HTML / CSS కోడ్ (రంగులు మరియు ఇతర ఫార్మాటింగ్ వంటివి) వంటి ఇతర అంశాలు, లేదా కూడా
  • పదం జతల, పదబంధాలు మరియు
  • మెటా సమాచారం (ఉదాహరణకు, ఒక నిర్దిష్ట పదబంధం కనిపిస్తుంది, ఉదాహరణకు).

ఉదాహరణకు, "కార్టీసియన్" ఉదాహరణకు, స్పామ్లో ఎప్పుడూ కనిపించకపోయినా, తరచూ మీరు అందుకున్న చట్టబద్ధమైన ఇమెయిల్లో, "కార్టీసియన్" స్పామ్ సున్నాకి దగ్గరగా ఉందని సూచిస్తుంది. "టోనర్", మరోవైపు, ప్రత్యేకంగా మరియు తరచుగా స్పామ్లో కనిపిస్తుంది. "టోనర్" స్పామ్లో కనిపించే అధిక సంభావ్యతను కలిగి ఉంది, 1 (100%) కంటే తక్కువ కాదు.

ఒక కొత్త సందేశం వచ్చినప్పుడు, ఇది బేసిసియన్ స్పామ్ వడపోత ద్వారా విశ్లేషించబడుతుంది, మరియు స్పామ్గా సంపూర్ణ సందేశాన్ని సంభావ్యత వ్యక్తిగత లక్షణాలను ఉపయోగించి లెక్కించబడుతుంది.

సందేశాన్ని "కార్టీసియన్" మరియు "టోనర్" రెండింటిని కలిగిఉండండి. ఈ పదాల నుండి మాత్రమే మేము స్పామ్ లేదా సక్రమం మెయిల్ కలిగి ఉన్నాయని ఇంకా స్పష్టంగా తెలియలేదు. ఇతర లక్షణాలు (ఆశాజనక మరియు అత్యంత బహుశా) స్పామ్ లేదా మంచి మెయిల్ గా సందేశాన్ని వర్గీకరించడానికి వడపోత అనుమతించే సంభావ్యతను సూచిస్తాయి.

బయేసియన్ స్పామ్ వడపోతలు స్వయంచాలకంగా తెలుసుకోగలవు

ఇప్పుడు మేము వర్గీకరణను కలిగి ఉన్నాము, ఫిల్టర్ను మరింతగా శిక్షణ ఇవ్వడానికి సందేశాన్ని ఉపయోగించవచ్చు. ఈ సందర్భంలో, మంచి కార్డును సూచిస్తున్న "కార్టీసియన్" యొక్క సంభావ్యత తగ్గించబడుతుంది ("కార్టీసియన్" మరియు "టోనర్" రెండింటినీ కలిగిన సందేశాన్ని స్పామ్గా గుర్తించినట్లయితే) లేదా స్పామ్ను సూచించే "టోనర్" యొక్క సంభావ్యత పునఃపరిశీలించబడాలి.

ఈ ఆటో-అనుకూల సాంకేతికతను ఉపయోగించి, బీస్సియన్ ఫిల్టర్లు చెయ్యవచ్చు వారి స్వంత మరియు వినియోగదారు నిర్ణయాలు రెండింటి నుండి తెలుసుకోండి (ఫిల్టర్ల ద్వారా ఆమె తప్పుగా సరిచేసినట్లయితే). బయేసియన్ వడపోత యొక్క స్వీకృతి కూడా వారు వ్యక్తిగత ఇమెయిల్ వినియోగదారునికి అత్యంత ప్రభావవంతమైనదిగా చేస్తుంది. చాలామంది ప్రజల స్పామ్కు ఇదే లక్షణాలు ఉన్నప్పటికీ, చట్టబద్ధమైన మెయిల్ ప్రతిఒక్కరికీ లక్షణాత్మకంగా విభిన్నంగా ఉంటుంది.

ఎలా స్పామర్లు గత బీస్సియన్ వడపోతలు పొందవచ్చు?

స్పామ్ వంటి బయేసియన్ స్పామ్ వడపోత ప్రక్రియ కోసం చట్టబద్ధమైన మెయిల్ యొక్క లక్షణాలు చాలా ముఖ్యమైనవి. ఫిల్టర్లు ప్రతి యూజర్ కోసం ప్రత్యేకంగా శిక్షణ పొందినట్లయితే, స్పామర్లు ప్రతిఒక్కరి (లేదా చాలా మంది ప్రజల) స్పామ్ ఫిల్టర్లకు చుట్టూ పనిచేయడం కష్టతరం సమయం ఉంటుంది, మరియు ఫిల్టర్లు దాదాపు ప్రతిదీ స్పామర్లు ప్రయత్నించండి.

వారి స్పామ్ సందేశాలు ప్రతి ఒక్కరికి లభించే సాధారణ ఇమెయిల్ లాగా సంపూర్ణంగా కనిపించేలా ఉంటే స్పామర్లు బాగా శిక్షణ పొందిన బయేసియన్ ఫిల్టర్లను మాత్రమే చేస్తారు.

స్పామర్లు సాధారణంగా ఇటువంటి సాధారణ ఇమెయిల్లను పంపరు. ఈ ఇమెయిళ్ళు వ్యర్థ ఇమెయిల్గా పనిచేయడం లేదు కాబట్టి ఇది ఊహించనివ్వండి.అందువల్ల, సాధారణ, బోరింగ్ ఇమెయిల్స్ గత స్పామ్ ఫిల్టర్లను చేయడానికి ఒకే మార్గం ఉన్నప్పుడు అవకాశాలు వారు చేయరు.

స్పామర్లు ఎక్కువగా సాధారణ-కనిపించే ఇమెయిళ్ళకు మారడం వలన, మేము మా ఇన్ బాక్స్ లలో చాలా స్పామ్ను చూస్తాము, ఇ-మెయిల్ బెయిలసియన్ రోజుల్లో (లేదా చెత్తగా) ఉన్నందున ఇమెయిల్ నిరాశకు గురవుతుంది. ఇది స్పామ్ యొక్క అనేక రకాలైన మార్కెట్లకు కూడా భగ్నం చేసింది, అయితే, దీర్ఘకాలం కొనసాగేది కాదు.

బలమైన సూచికలు బయేసియన్ స్పామ్ ఫిల్టర్ యొక్క ఆచిల్లెస్ హీల్ కావచ్చు

స్పామర్లు వారి సాధారణ కంటెంట్తో బయేసియన్ వడపోత ద్వారా వారి మార్గం పనిచేయడానికి ఒక మినహాయింపును గుర్తించవచ్చు. ఇది బయేసియన్ గణాంకాల యొక్క స్వభావంతో మంచి మెయిల్ లో చాలా తరచుగా కనిపించే ఒక పదం లేదా లక్షణం వడపోత ద్వారా స్పామ్ లాగా రేట్ చేయటానికి ఏవైనా సందేశాన్ని తిరగరాయడం చాలా ముఖ్యమైనది.

మీరు తెరిచిన సందేశాలు చూసేందుకు HTML రిసీన్ రశీదులను ఉపయోగించడం ద్వారా మీ ఖచ్చితమైన ఫైర్-మెయిల్-మెయిల్ పదాలను గుర్తించడానికి స్పామర్లు ఒక మార్గాన్ని కనుగొంటే, వాటిలో ఒకదానిని ఒక జంక్ మెయిల్ లో చేర్చండి మరియు మీకు బాగా- శిక్షణ పొందిన బేయేసియన్ ఫిల్టర్.

జాన్ గ్రహం-కమ్మింగ్ ఇద్దరి బయేసియన్ ఫిల్టర్లు ఒకదానికొకటి వ్యతిరేకంగా పనిచేయడం ద్వారా ఈ విధంగా ప్రయత్నించారు, "మంచి" వడపోత ద్వారా సందేశాలు పొందటానికి సంశయించబడే "చెడ్డ" ఒకటి. అతను అది పనిచేస్తున్నట్లు చెబుతుంది, అయితే ప్రక్రియ సమయం మరియు మిశ్రమంగా ఉంటుంది. మనం ఈ సంఘటన యొక్క ఎక్కువ భాగం చూస్తాము, కనీసం పెద్ద ఎత్తున కాదు, వ్యక్తుల ఇమెయిల్ లక్షణాలకు అనుగుణంగా లేదు. స్పామర్లు సంస్థలకు కొన్ని కీలక పదాలను గుర్తించడానికి ప్రయత్నించవచ్చు (బదులుగా IBM వద్ద కొంతమంది కోసం "అల్మాడెన్" వంటిది?).

సాధారణంగా, స్పామ్ ఎల్లప్పుడూ (గణనీయంగా) సాధారణ మెయిల్ నుండి వేరుగా ఉంటుంది లేదా ఇది స్పామ్గా ఉండదు.

బాటమ్ లైన్: బయేసియన్ వడపోత యొక్క శక్తి దాని బలహీనత

బయేసియన్ స్పామ్ ఫిల్టర్లుకంటెంట్ ఆధారిత ఫిల్టర్లు ఆ:

  • ఉన్నాయివ్యక్తిగత ఇమెయిల్ యూజర్ యొక్క స్పామ్ మరియు మంచి మెయిల్ను గుర్తించడానికి ప్రత్యేకంగా శిక్షణ పొందింది, వాటిని స్పెమెర్లకు స్వీకరించడానికి వారికి అత్యంత సమర్థవంతమైన మరియు కష్టతరం.
  • నిరంతరం మరియు ఎక్కువ కృషి లేదా మాన్యువల్ విశ్లేషణ లేకుండా చేయవచ్చుస్వీకరించే స్పామర్లు 'తాజా ఉపాయాలు కు.
  • వ్యక్తిగత యూజర్ యొక్క మంచి మెయిల్ను పరిగణలోకి తీసుకొని చాలా వరకుతప్పుడు పాజిటివ్స్ తక్కువ రేటు.
  • దురదృష్టవశాత్తు, ఇది బయేసియన్ వ్యతిరేక-స్పామ్ ఫిల్టర్లలో గుడ్డి నమ్మకాన్ని కలిగిస్తే, అది దానిని అందించిందిఅప్పుడప్పుడు తప్పు మరింత తీవ్రమైనది. వ్యతిరేక ప్రభావంతప్పుడు ప్రతికూలతలు (సాధారణ మెయిల్ లాగా కనిపించే స్పామ్) వినియోగదారులను భంగపరిచే మరియు నిరాశపరిచేందుకు సామర్థ్యాన్ని కలిగి ఉంటుంది.